В Україні навчають ШІ, щоб розпізнати почерк лікарів
Міністерство економіки України разом із Державним архівом та іншими відомствами розпочало створення національного датасету україномовних рукописних матеріалів для навчання систем штучного інтелекту. Мета – навчити мовну модель розбирати старі рукописи, в тому числі – медичні довідки.
Про деталі проєкту розповів ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I, пишуть Українські новини.
Реалізація цієї ініціативи має пришвидшити цифровізацію державних послуг і сприяти оцифруванню архівних матеріалів.
Потреба у створенні такого датасету виникла під час роботи над проєктом «єДозвіл», який передбачає переведення процесу видачі ліцензій для підприємців у цифровий формат через «Дію». Для цього алгоритмам необхідно аналізувати документи, які подають заявники.
Читати ще: Папа Римський закликав священників відмовитися від ШІ для написання проповідей
Зокрема, для отримання частини ліцензій потрібно завантажувати дипломи, видані ще у 1990-х роках, які часто заповнені від руки, мають низьку якість зображення або пошкодження. Як зазначив Войтех, наявні OCR-системи не забезпечують належного розпізнавання таких матеріалів українською мовою.
За словами розробників, у відкритому доступі відсутні якісні розмічені корпуси українського рукописного тексту, необхідні для навчання моделей. Тому Мінекономіки ініціювало співпрацю з іншими державними установами для швидкого формування відповідної бази.
Ключовим партнером став Державний архів України, який зацікавлений у використанні технології для оцифрування мільйонів сторінок історичних документів і спрощення доступу до інформації.
Підписуйтесь на наш Telegram-канал, аби першими дізнаватись найактуальніші новини Волині, України та світу
Про деталі проєкту розповів ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I, пишуть Українські новини.
Реалізація цієї ініціативи має пришвидшити цифровізацію державних послуг і сприяти оцифруванню архівних матеріалів.
Потреба у створенні такого датасету виникла під час роботи над проєктом «єДозвіл», який передбачає переведення процесу видачі ліцензій для підприємців у цифровий формат через «Дію». Для цього алгоритмам необхідно аналізувати документи, які подають заявники.
Читати ще: Папа Римський закликав священників відмовитися від ШІ для написання проповідей
Зокрема, для отримання частини ліцензій потрібно завантажувати дипломи, видані ще у 1990-х роках, які часто заповнені від руки, мають низьку якість зображення або пошкодження. Як зазначив Войтех, наявні OCR-системи не забезпечують належного розпізнавання таких матеріалів українською мовою.
За словами розробників, у відкритому доступі відсутні якісні розмічені корпуси українського рукописного тексту, необхідні для навчання моделей. Тому Мінекономіки ініціювало співпрацю з іншими державними установами для швидкого формування відповідної бази.
Ключовим партнером став Державний архів України, який зацікавлений у використанні технології для оцифрування мільйонів сторінок історичних документів і спрощення доступу до інформації.
Знайшли помилку? Виділіть текст і натисніть
Підписуйтесь на наш Telegram-канал, аби першими дізнаватись найактуальніші новини Волині, України та світу
Коментарів: 0
Після підказок сканера волинські митники виявили у вантажівці міді під прикриттям алюмінію на майже 3 млн грн
Сьогодні 09:35
Сьогодні 09:35
ЄС заморозив Угорщині оборонне фінансування, – ЗМІ
Сьогодні 09:18
Сьогодні 09:18

Додати коментар:
УВАГА! Користувач www.volynnews.com має розуміти, що коментування на сайті створені аж ніяк не для політичного піару чи антипіару, зведення особистих рахунків, комерційної реклами, образ, безпідставних звинувачень та інших некоректних і негідних речей. Утім коментарі – це не редакційні матеріали, не мають попередньої модерації, суб’єктивні повідомлення і можуть містити недостовірну інформацію.