Fwdays
5 min readJul 31, 2020

Data Science fwdays: детально про доповіді

NLP чи Computer Vision? Яку сторону ви оберете?

На безкоштовній онлайн-конференції Data Science обирати не доведеться. 11 інформативних доповідей уже чекають на вас в програмі 8 та 15 серпня за тематиками:

👉 Natural Language Programming

👉 Computer Vision

👉 Загальні на Data Science тематику

Програма програмою, але наше діло — познайомити вас з усіма доповідями ближче. Біля кожної доповіді ставимо #NLP #CV #general для зручності пошуку через ctrl/cmnd+F 😉

З деякими спікерами вдалося поспілкуватися у форматі інтерв’ю, прикріпили на них посилання поряд з описами доповідей.

Тож, почнемо знайомство ⬇️

#NLP Thomas Wolf

Co-founder and Chief Science Officer у Hugging Face 🤗, займається transfer learning в NLP

Познайомить з NLP-проривами, які були результатом поєднання схем transfer learning та архітектури трансформерів. Друга частина доповіді буде присвячена впровадженню інструментів з відкритим кодом, випущених Hugging Face🤗, зокрема трансформерів, токенізаторів та бібліотек NLP.

#NLP Mohit Iyyer

Асистент професора з computer science в UMass Amherst, який раніше був дослідником в AI2.

У цьому виступі зупиниться на двох ключових проблемах, пов’язаних з моделями генерації довгих текстів:

(1) погіршення їх якості виведення у міру того, як вихідні дані стають довшими і більш складними

(2) їх загальна неефективність по пам’яті і швидкості, що викликає проблеми з затримкою коли вони розгорнуті для кінцевих користувачів.

Він розгляне ці проблеми в рамках практичного прикладу, для якого його лабораторія успішно побудувала і розгорнула систему для тисяч користувачів. Могіт буде обговорювати особливості їх архітектури моделі, стратегії навчання для максимального використання пам’яті і спрощені варіанти моделі для збільшення швидкості виведення.

#NLP Олексій Шашлюк

Data Scientist у SPD-Ukraine, який вже 2 роки працює на проєкті PitchBook. Вирішує задачі як класичного, так і глибокого навчання у сфері NLP.

Розгляне підходи до рішення задач розпізнавання сутностей у тексті (NER) та зв’язування їх з вже існуючими у базі даних сутностями за допомогою запитів схожості.

Також, Олексій більш детально зупиниться на різних типах схожості та як вони впливають на результат.

#NLP Костянтин Омелянчук та Олександр Скуржанський | Інтерв’ю

Applied Research Scientists у Grammarly.

Про шлях від ідеї пришвидшення Grammatical Error Correction (GEC) моделі до State-of-the-Art результатів у області. Згадаємо про поточний стан GEC та тренування Трансформерів.

Розповідь про те, як їм [Grammarly] вдалося досягнути SOTA на задачі GEC і які перепони трапилися на шляху до цього.

#NLP Марія Гаврилович

Data scientist у machine learning команді в Wix, спеціалізується на NLP-рішеннях.

Як Active Learning може значно зменшити кількість розмічених даних для навчання за класичними підходами, а також поєднаємо Active Learning та Weak Supervision активне навчання та слабкий нагляд, скориставшись обома методами та досягнувши найкращих показників.

#NLP #general Галина Олійник

Керівник data science відділу 1touch.io. Має великий досвід розробки end-to-end NLP рішень, орієнтованих головним чином на виконання багатомовного аналізу для систем з високим навантаженням.

Про найгірші та найкращі способи виявлення особистих та чутливих даних у наборах даних про навчання, щоб зробити їх сумісними з правилами GDPR, CCPA та іншими правилами захисту даних, ефективними в США та ЄС, але все ж корисні з точки зору машинного навчання.

#NLP #general Михайло Соколов | Інтерв’ю

CTO та співзасновник Dex Technologies, Стратег даних, NLP експерт та архітектор систем.

У 2019 році було вирішено створити невеликий стартап на перетині біомедицини та NLP. За час розробки вони стали свідками того, на що спроможні великі наукові спільноти за короткий проміжок часу.

Доповідь буде якраз про те, які проблеми наразі можливо вирішити за допомогою інструментів BioNLP та які проблеми існують у самому BioNLP.

#NLP #CV #general Дмитро Войтех | Інтерв’ю

Machine Learning Engineer у компанії Proxet, який займається end-to-end розробкою ML продуктів.

Доповідь про досвід Дмитра у побудові мультимодальних векторних просторів для пошукових систем з медіа контентом на прикладі великої платформи gif зображень.

Цим проєктом він продовжує займатися і зараз, тому це, свого роду, ongoing research.

Цей підхід дозволив отримати універсальні репрезентації пошукових запитів, гіфок та тегів.

Крім того, він розповість про різноманітні кейси їх використання та того, як вони покращили engagement метрики даної платформи.

#CV Юлія Гончаренко (YouScan) | Інтерв’ю

Data Scientist в YouScan, у якої основна сфера інтересів — CV.

Поговоримо про metric learning на прикладі задачі logo recognition в YouScan: задача, дані, різні лосси і підходи, метрики, які вони використовували, підводні камені та особливості, речі, які спрацювали та ні.

#CV Іван Сагумбаєв | Інтерв’ю

Middle Research Engineer в компанії Ciklum, який спеціалізується на задачах комп’ютерного зору з використання методів глибинного навчання.

Доповідь буде присвячена аналізу тривимірних даних, а саме: трикутні сітки та хмари точок. Аналіз “звичайних” двовимірних зображень для задач сегментації, детектування об’єктів та класифікації досяг високого рівня. Але використання даних з тривимірного простору потенційно додає можливостей для покращення якості аналізу для кожної задачі окремо.

Перша частина доповіді буде присвячена саме цьому, як підходи для 2D задач можливо застосувати і для 3D даних.

Друга частина доповіді буде присвячена пошуку відповідностей між хмарами точок та синтетичними моделями.

У заключній частині розповість про проєкт, над яким зараз працює (RoButcher).

Нагадуємо, що онлайн-конференція Data Science fwdays’20 є абсолютно безкоштовною для всіх учасників. Реєстрація ще триває 😉

Під егідою конференції нещодавно ми також провели актуальний на часі мітап “Штучний інтелект без фінансових санкцій: юридична сторона розробки та аутсорсингу” з Андрієм Логвиненко.

Кориснi доповiдi з минулорiчної конференції Data Science fwdays шукайте на нашому YouTube каналі.

Зустрінемося онлайн вже 8 та 15 серпня 💻

Fwdays
Fwdays

Written by Fwdays

We organize large conferences (JS, PHP, .NET, Highload, etc.) and meetups

No responses yet