офлайн

Handwritten to Data

Початок:

16 квітня

Призовий фонд:

$7000

Формат:

Kaggle-челендж з фіналом у Києві

Вартість участі:

Безоплатно

Про челендж:

Поки держава активно цифровізується, нам усе ще бракує простих і відкритих інструментів для роботи з українськими рукописними документами. Більшість існуючих рішень або закриті, або зібрані з окремих частин і погано масштабуються. У результаті це сповільнює запуск і розвиток державних сервісів на кшталт єДозвіл та інших цифрових послуг.

Тому ми в AI HOUSE, разом із Міністерством економіки, довкілля та сільського господарства та Українським католицьким університетом, за підтримки Міністерства цифрової трансформації України, запускаємо АІ-челендж, на якому учасники будуватимуть CV-рішення для розпізнавання українських рукописних документів: заяв, довідок, журналів, підписів, печаток та архівних матеріалів — під реальні процеси та задачі.

Під час челенджу ви не просто потренуєте моделі на датасеті, а допоможете створити інструменти, які можуть бути впроваджені в роботу міністерств, спростити обробку документів і пришвидшити надання державних послуг.

Для кого:

  • AI/ML-інженери, data scientists, дослідники
  • Студенти технічних спеціальностей, що працюють із Computer Vision, OCR/HTR, обробкою зображень і тексту
  • Українські та міжнародні стартапи, R&D-команди та університетські лабораторії

Челендж пройде у двох форматах:

  • Онлайн-етап [Kaggle]: Учасники розробляють моделі для розпізнавання рукописного тексту, а результати автоматично оцінюються на платформі
  • Фінал [офлайн у Києві]: Топ команди за результатами онлайн-етапу презентують свої рішення наживо: демонструють роботу моделей, підхід до reproducibility та реальні результати на даних

Що отримаєте:

  • Фонд у $7000 для команд-переможців
  • Шанс вплинути на цифровізацію державних процесів і створення відкритої інфраструктури для роботи з документами
  • Можливість перевірити свої рішення на реальних кейсах державних сервісів, зокрема єДозвіл
  • Менторську підтримку експертів з комп’ютерного зору та OCR/HTR
  • Доступ до унікального датасету українських рукописних документів із різних доменів і типів почерку [держархів, університети, НСТУ та інші джерела]
  • AWS credits для тренування та тестування моделей
  • Можливість подальшого впровадження рішень у публічному секторі разом із партнерами проєкту, зокрема Міністерством економіки України

Реєстрація та участь:

— Доступ до завдання на Kaggle відкриється 16 квітня та триватиме до 15 червня. 4 липня ми проведемо фінальну офлайн-подію;

— Ви можете брати участь командами 2–5 людей, індивідуально або долучитися до наявних команд;

— Кількість учасників не обмежена.

Експерти, що підтримуватимуть команди

Дмитро Войтех
Дмитро Войтех

Радник з питань ШІ в Міністерстві економіки України, Al/ML Lead у Мрія

  • ML Engineer із понад 8 роками комерційного досвіду у розробці ML-рішень, зокрема LLM-застосунків, рекомендаційних систем, пошуку, computer vision та NLP.
  • Має глибоку практичну експертизу у впровадженні MLOps і LLMOps та консультує команди щодо проєктування масштабованих ML-систем.
  • Працює ML Lead національної освітньої платформи «Мрія», де відповідає за AI-функціональність, а також є радником Міністерства економіки України, підтримуючи ініціативи з цифрової трансформації держави.
Роман Кислий
Роман Кислий

Head of NLP Lab в KSE

  • Дослідник та інженер із понад десятирічним досвідом у NLP, LLMs, мультимодальних моделях та побудові AI-систем.
  • Має ступінь PhD з комп’ютерних наук, очолює NLP Lab у Київській школі економіки та працює Data Scientist у Visa, де розробляє й впроваджує AI-рішення у складних корпоративних середовищах. Керує міждисциплінарними командами, поєднуючи фундаментальні дослідження з практичним застосуванням.
  • Викладає в КПІ, є співорганізатором конференції UNLP та активно розвиває українську AI-спільноту.
Мар'яна Романишн
Мар'яна Романишн

Computational Linguist у Superhuman (ex-Grammarly)

  • Понад десять років очолює команду computational linguists у Superhuman, де працює над алгоритмами виправлення помилок і покращення текстів.
  • Має глибоку експертизу в NLP — від синтаксичного аналізу до сентимент-аналізу та видобування фактів — і особливу увагу приділяє розвитку інструментів для обробки української мови.
  • Мар’яна є організаторкою UNLP конференції, співлідеркою ініціативи lang-uk та членкинею Експертного комітету з розвитку AI при Мінцифрі.
Назарій Друщак
Назарій Друщак

Al Technical Consultant у SoftServe, PhD-кандидат в УКУ

  • Data Scientist зі спеціалізацією в NLP, Generative AI, Agentic AI та Responsible AI.
  • Очолює AI-дослідницькі команди, працює над оцінюванням LLM, мультимодальними RAG-системами, multi-agent архітектурами, генерацією синтетичних даних і модернізацією коду.
  • Активно розвиває напрям етичного використання AI, створює навчальні матеріали з NLP та ділиться експертизою через лекції й публічні виступи.
Юрій Панів
Юрій Панів

Project Lead у Lapa LLM, Data Scientist у Nortal, PhD-студент в УКУ

  • Data Scientist із досвідом роботи над проєктами в державному секторі, охороні здоров’я, ритейлі та фінансах — від аналітики даних до рекомендаційних систем.
  • Активно долучається до open-source ініціатив, розробляючи моделі синтезу та розпізнавання мовлення з фокусом на малоресурсні мови, зокрема українську та кримськотатарську.
  • Є Project Lead Lapa LLM та співтворцем одного з найефективніших українських великих мовних моделей у межах ініціативи «Made Ukrainian NLP Great».
Ганна Юхименко
Ганна Юхименко

Lead Developer at MamayLM, Research Engineer в ETH AI Center

  • Працює над розробкою українських мовних моделей і пост-тренуванням LLM у межах міжнародних open-source ініціатив.
  • Активно долучається до проєктів із розробки безпечних багатомовних моделей разом із ETH Zurich, Hugging Face та Cohere Labs, просуваючи українську мову в глобальній AI-спільноті.
  • Досліджує можливості та ризики LLM у різних мовах і має досвід повного циклу розробки моделей: від тренування на GPU-кластерах до адаптації під різні сценарії використання.

Організатори й партнери:

Організатори:

За підтримки:

Генеральні партнери:

Технічні партнери:

Партнери з даних:

Поширені запитання

  • Як взяти участь?

    Достатньо мати акаунт на Kaggle, зайти на сторінку челенджу та долучитися до змагання. Можна брати своєю командою [2-5 учасників], індивідуально або долучитися до наявних команд челенджу. Повний перелік правил та умов участі дивіться за посиланням.

  • Участь платна?

    Ні, участь безоплатна.

  • Можна брати участь віддалено?

    Так, весь челендж проходить онлайн. Але вирішальний етап  для фіналістів челенджу пройде офлайн у Києві.

  • Коли початок і кінець?

    Челендж стартує з моменту публікації задачі на Kaggle. Онлайн-етап триває до 15 червня, після чого визначаються фіналісти.

  • Мова події?

    Українська. Датасети — українською.

  • Залишились питання?

    Пишіть: events@aihouse.org.ua