„БУКИ“ – нова дигитална платформа за транскрипција на говор на македонски јазик
На 9.10.2024 г. (среда) во 14:00 часот, во просториите на Ректоратот на Универзитетот „Св. Кирил и Методиј“ во Скопје, ќе се одржи промоција на „Буки“ – отворен дигитален модел, базиран на вештачка интелигенција, за препознавање и транскрипција на говор на македонски јазик.
Моделот е креиран од Дејан Порјазовски, експерт за технологии на вештачка интелигенција за препознавање говор од Универзитетот „Аалто“ во Финска, проф. д-р Никола Стиков од Техничкиот Универзитет во Монтреал, Канада и проф. д-р Ордан Чукалиев, како дел од активностите на Центарот за напредни интердисциплинарни истражувања (ЦеНИИс) при УКИМ. Моделот овозможува пренос – од усно изговорен, во напишан текст, кој содржи интерпункција, мали и големи букви.
Во моментов функционира моделот за литературен јазик, но се работи и на втор модел, кој би ги препознавал македонските дијалекти. На промоцијата ќе се направи споредба помеѓу новиот Буки – Виспер (подобрена верзија на Виспер) и најголемите „опен сорс“ модели достапни во моментов – Виспер (OpenAI) и Мета (Фејсбук).
Во тренирањето на „Буки“ се употребени оригинални податоци обезбедени од проф. д-р Илина Јакимовска, паководител на Институтот за етнологија и антропологија на Природно-математичкиот факултет при УКИМ и тоа од: Дигиталниот архив за етнолошки и антрополошки ресурси (ДАЕАР) на Институтот за етнологија и антропологија, Природно-математичкиот факултет при УКИМ; аудиоверзијата на меѓународното списание „ЕтноАнтропоЗум“ на истиот институт; аудио подкастот „Обични луѓе“ на Илина Јакимовска; научните видеа од серијалот „Наука за деца“, фондацијата КАНТАРОТ и македонската верзија на Mozilla Common Voice (верзија 18.0).
По промоцијата, дигиталниот модел ќе биде отворен за тестирање. Секој кој сака да придонесе, ќе може да го донира својот глас – да прочита текст на македонски и да го прикачи на платформата Мозила, за што на промоцијата ќе бидат споделени подетални информации. За таа цел, УКИМ ќе започне кампања „Донирај глас“.
Новата дигитална платформа може да им биде од корист на сите кои работат со транскрипција на текст (интервјуа, предавања, теренски белешки, потсетници), на лица со хендикеп, транскрипција и анотација на македонското културно наследство, архиви, снимки во МРТВ итн.
Името „Буки“ произлегува од името на втората буква во глаголицата Ⰱ („буки“) – со значење буква или писмо. На англиски јазик, истото ќе биде транскрибирано со Bookie.
Линкот за тестирање на дигиталниот модел ќе биде доставен за време на промоцијата.
Универзитет „Св. Кирил и Методиј“ во Скопје