Українськомовні тексти зараз створюються штучним інтелектом з використанням перекладів з інших мов – науковець 06/10/2025 19:18 Укрінформ Наразі існує недостатня кількість анотованих корпусів україномовних текстів, необхідних для навчання великих мовних моделей.
На цьому наголосив проректор з наукової роботи Київського політехнічного інституту імені Ігоря Сікорського, доктор технічних наук, професор Сергій Стіренко під час круглого столу на тему «Креативні та ефективні методи стимулювання використання та розвитку української мови» в Укрінформі.
«Ключова проблема полягає в тому, що наразі недостатньо анотованих корпусів україномовних текстів для навчання великих мовних моделей. Це головна проблема, оскільки текст, який генерується українською мовою, переважно походить з перекладів з інших мов, особливо з російської. Наприклад, під час спроби перекласти щось з французької мови спочатку перекладають на російську, а потім на українську. Очевидно, що такі переклади неякісні, зокрема через наявність кальок російських слів. Коли джерелом тексту є не оригінал, а посередник, це створює значну проблему та загрозу», – зазначив Стіренко.
Стіренко наголосив на необхідності створення високоякісних анотацій до українських текстів для їх використання в навчанні нейронних мереж, які є важливими для генерації текстів у сфері штучного інтелекту. У цій роботі можуть брати участь студенти, фахівці лінгвістичних кафедр та представники інших установ.
Крім того, ректор Київського національного університету імені Тараса Шевченка Володимир Бугров зазначив, що ситуація з українською мовою погіршується на повсякденному рівні. Він зазначив, що у невимушених розмовах молодь частіше використовує російську, ніж українську. Для вирішення цієї проблеми, на його думку, вкрай важливо покращити книговидавництво, зокрема, випускаючи двомовні книги, такі як кримськотатарсько-українські та англо-українські видання.
Крім того, існує дефіцит термінологічних словників. Ректор КНУ зазначив, що цього року Інститут філології започаткував магістерську програму з юридичної лінгвістики, спрямовану, серед іншого, на навчання студентів якісному перекладу європейського законодавства.
Театральна та кіноактриса Леся Самаєва розповіла, що під час проведення курсу акторської майстерності для дітей вона зіткнулася з нестачею українських перекладів спеціалізованих навчальних та літературних творів.
Український вчений, перекладач і письменник Максим Стріха стверджував, що всі тексти з європейського канону вже перекладені українською мовою, зокрема класичні твори, призначені для театру.
«Як український перекладач, я вважаю себе щасливчиком: я зробив значний внесок, переклавши «Кентерберійські оповідання» Джеффрі Чосера. Це був останній великий текст європейського канону, якого бракувало українською мовою. От і все; все було завершено у 2019 році. Якщо вам цікаво, перегляньте бібліографічні покажчики, навіть Вікіпедія може допомогти – ви знайдете чудові українські переклади», – зазначила Стріха.
Зокрема, він зазначив, що існує 13 або 14 повних українських перекладів «Гамлета» Шекспіра, а також його основних п’єс.
Тим часом, генеральний директор і художній керівник Національного академічного театру імені Лесі Українки Кирило Кашліков зазначив, що з початку повномасштабного вторгнення вистави в театрі йдуть виключно українською мовою.
«Якщо до лютого (2022 року – ред.) вистави були повністю російською мовою, то зараз усі 51 вистави йдуть українською. Я вважаю це значним досягненням», – наголосив Кашликов.
Як повідомляв Укрінформ, 16 липня 2019 року набрав чинності Закон України «Про забезпечення функціонування української мови як державної». Цей закон закріплює статус української мови як єдиної державної мови, а його положення поступово впроваджуються з метою забезпечення того, щоб українська мова стала виключною мовою, що використовується в державній діяльності та діяльності місцевого самоврядування, а також в інших сферах суспільного життя.
Література Освіта Українська мова Штучний інтелект Письменник Переклад
Источник: www.ukrinform.ua