В Україні навчають ШІ, щоб розпізнати почерк лікарів
Міністерство економіки України разом із Державним архівом та іншими відомствами розпочало створення національного датасету україномовних рукописних матеріалів для навчання систем штучного інтелекту. Мета – навчити мовну модель розбирати старі рукописи, в тому числі – медичні довідки.
Про деталі проєкту розповів ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I, пишуть Українські новини.
Реалізація цієї ініціативи має пришвидшити цифровізацію державних послуг і сприяти оцифруванню архівних матеріалів.
Потреба у створенні такого датасету виникла під час роботи над проєктом «єДозвіл», який передбачає переведення процесу видачі ліцензій для підприємців у цифровий формат через «Дію». Для цього алгоритмам необхідно аналізувати документи, які подають заявники.
Читати ще: Папа Римський закликав священників відмовитися від ШІ для написання проповідей
Зокрема, для отримання частини ліцензій потрібно завантажувати дипломи, видані ще у 1990-х роках, які часто заповнені від руки, мають низьку якість зображення або пошкодження. Як зазначив Войтех, наявні OCR-системи не забезпечують належного розпізнавання таких матеріалів українською мовою.
За словами розробників, у відкритому доступі відсутні якісні розмічені корпуси українського рукописного тексту, необхідні для навчання моделей. Тому Мінекономіки ініціювало співпрацю з іншими державними установами для швидкого формування відповідної бази.
Ключовим партнером став Державний архів України, який зацікавлений у використанні технології для оцифрування мільйонів сторінок історичних документів і спрощення доступу до інформації.
Підписуйтесь на наш Telegram-канал, аби першими дізнаватись найактуальніші новини Волині, України та світу
Про деталі проєкту розповів ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I, пишуть Українські новини.
Реалізація цієї ініціативи має пришвидшити цифровізацію державних послуг і сприяти оцифруванню архівних матеріалів.
Потреба у створенні такого датасету виникла під час роботи над проєктом «єДозвіл», який передбачає переведення процесу видачі ліцензій для підприємців у цифровий формат через «Дію». Для цього алгоритмам необхідно аналізувати документи, які подають заявники.
Читати ще: Папа Римський закликав священників відмовитися від ШІ для написання проповідей
Зокрема, для отримання частини ліцензій потрібно завантажувати дипломи, видані ще у 1990-х роках, які часто заповнені від руки, мають низьку якість зображення або пошкодження. Як зазначив Войтех, наявні OCR-системи не забезпечують належного розпізнавання таких матеріалів українською мовою.
За словами розробників, у відкритому доступі відсутні якісні розмічені корпуси українського рукописного тексту, необхідні для навчання моделей. Тому Мінекономіки ініціювало співпрацю з іншими державними установами для швидкого формування відповідної бази.
Ключовим партнером став Державний архів України, який зацікавлений у використанні технології для оцифрування мільйонів сторінок історичних документів і спрощення доступу до інформації.
Знайшли помилку? Виділіть текст і натисніть
Підписуйтесь на наш Telegram-канал, аби першими дізнаватись найактуальніші новини Волині, України та світу
Коментарів: 0
У Луцьку хочуть підвищити тарифи на вивезення сміття
Сьогодні 16:06
Сьогодні 16:06
Підозрюють у держзраді: в Києві затримали «ексміністра» енергетики Криму Сергія Колобова
Сьогодні 15:34
Сьогодні 15:34
Зніме випуск для «Реальної історії»: журналіст Акім Галімов у Луцьку зустрівся з шанувальниками. Фото
Сьогодні 15:17
Сьогодні 15:17
Євросоюз надав Україні 3,9 млрд євро на дрони
Сьогодні 14:45
Сьогодні 14:45
У PortCity −50% на ранкові розваги у Figli Migli
Сьогодні 14:28
Сьогодні 14:28
Семеро дітей – у лікарні: повідомили про стан травмованих від удару блискавки на Волині
Сьогодні 14:12
Сьогодні 14:12
Вибух в Монако: дружині українського підсанкційного олігарха Єрмолаєва ампутували ноги, – медіа
Сьогодні 13:40
Сьогодні 13:40
За вихідні на Волині спіймали 18 п'яних водіїв
Сьогодні 13:23
Сьогодні 13:23

Додати коментар:
УВАГА! Користувач www.volynnews.com має розуміти, що коментування на сайті створені аж ніяк не для політичного піару чи антипіару, зведення особистих рахунків, комерційної реклами, образ, безпідставних звинувачень та інших некоректних і негідних речей. Утім коментарі – це не редакційні матеріали, не мають попередньої модерації, суб’єктивні повідомлення і можуть містити недостовірну інформацію.