Інтерв’ю з Дмитром Войтехом| Data Science fwdays’20

Fwdays
4 min readJul 15, 2020

--

Зустрічайте першу розмову з серії інтерв’ю зі спікерами безкоштовної онлайн-конференції Data Science fwdays’20, яка відбудеться 8 та 15 серпня. Конференція присвячена Artificial Intelligence, Machine learning, Data Science і відбудеться уже другий рік поспіль. Будемо говорити про вплив Data Science на наше життя, які існують методи аналізу даних, чим займаються команди Data Science і які складнощі можуть виникнути в процесі дослідження і не тільки.

А тим часом знайомтесь — Дмитро Войтех, Machine Learning Engineer у компанії Proxet та фанат музики і автомобілів, першим зустрівся з нами та дав розгорнуті відповіді на запитання.

Дмитро розповів про свій старт в Machine Learning, про доповідь на Data Science fwdays‘20, про книги, які варто прочитати Machine Learning інженеру та згадав приклади продуктів, де використовується ML.

Як ти зацікавився Machine Learning?

Багато в чому на моє майбутнє спрямування вплинув Київський природничо-науковий ліцей №145, в якому я навчався у старших класах. Проте тоді не було як такого мейнстріму, пов’язаного з DS та ML, тому це більше проявлялося в інтересі до фізики, математики та програмування, участі в олімпіадах і конкурсах. Саме тоді мене зацікавило застосування алгоритмів, теорії керування та методів аналізу даних у звичних сферах, з якими людина стикається у повсякденному житті. Як результат, в 11-ому класі я представляв Україну на міжнародному конкурсі Intel ISEF у США з власним проєктом, в якому запропонував інтелектуальну енергетично-інформаційну систему, що поєднує приватні домогосподарства та забезпечує їх екологічне, безперебійне та ефективне електропостачання. Поглянувши на цей опис, мабуть, багато хто скаже, що дана проблема на сьогодні навіть ще актуальніша, ніж тоді, 7 років тому ;)

Ближче з машинним навчанням я почав знайомитися десь починаючи з середини бакалаврату КПІ. Саме тоді почали надходити новини про прориви в методах та засобах розв’язання задач комп’ютерного зору тощо.

Якраз у той час стало надзвичайно модним брати теми курсових, які будь-яким чином пов’язані з нейронними мережами. Навіть просто наявність такої теми робила тебе набагато розумнішим в очах майже будь-якого викладача ;)

Ну і, звичайно, своїм шкільним проєктом я продовжував займатися, випробовуючи у ньому вже різні методи машинного навчання, в тому числі Reinforcement Learning.

Щодо професійної складової, то почав працювати я в класичній веб-розробці, проте через деякий час в компанії з’явився новий відділ, який займався проєктами з research складовою в плані алгоритмів та Data Science. Я тоді був надзвичайно радий, що отримав можливість приєднатися і спробувати свої сили на реальних задачах, в режимі реального часу розбиратися з новими методами та алгоритмами.

Чим саме ти займаєшся у Proxet?

Моя робота у Proxet повністю відповідає визначенню професії ML Engineer. Всі проєкти, які приходять до Proxet, а також внутрішні продукти, які пов’язані з машинним навчанням, потрапляють до нашої ML команди. Щодо тих проєктів, над якими мені пощастило попрацювати, то на поточному проєкті я займаюся побудовою ML продуктів у режимі end-to-end, тобто, починаючи від research фази та закінчуючи впровадженням моделей у реальні сервіси та їх підтримкою у production середовищі.

Про що буде твоя доповідь на Data Science fwdays‘20?

У доповіді я хочу поділитися своїм досвідом побудови мультимодальних векторних просторів для пошукових систем з медіа контентом на прикладі великої платформи gif зображень. Цим проєктом продовжую займатися і зараз, тому це, свого роду, ongoing research. Цей підхід дозволив отримати універсальні репрезентації пошукових запитів, гіфок та тегів. Крім того, я розповім про різноманітні кейси їх використання та того, як вони покращили engagement метрики даної платформи.

Яку книгу рекомендуєш прочитати кожному Machine Learning інженеру?

Друзі колись подарували мені книгу Deep Learning, за що я їм надзвичайно вдячний ;) Я вважаю, що ця книга на основі зрозумілого математичного базису дає дуже цілісне сприйняття та розуміння того, що таке машинне навчання та його застосування.

Назви, будь ласка, якісь круті для тебе приклади продуктів, де використовується Machine Learning?

Я захоплююся ідеями та застосування AI в біоінженерії, оскільки в недалекому майбутньому це може дозволити лікувати надскладні хвороби, вбивати віруси, моментально загоювати рани, а, можливо, і подолати процес старіння. Прикладом може бути той самий Regeneron, який наразі займається розробкою вакцин проти COVID-19, використовуючи в тому числі еволюційні алгоритми та штучний інтелект для генерації кандидатів.

Також для мене дуже цікаві проєкти, пов’язані з застосуванням Reinforcement Learning та інших методів теорії керування в енергетиці. В сьогоднішніх реаліях, коли на ринку електроенергії зростає частка малопрогнозованих і нестабільних відновлюваних джерел живлення, стрімко збільшується кількість електромобілів, як ніколи з’являється потреба в системах прогнозування на керування потоками електроенергії — як на рівні енергосистеми, так і на рівні домогосподарства. Цим зараз займаються величезна кількість компаній в рамках концепцій Smart Grid та Smart City.

Дай кілька порад, щоб тримати себе в життєвому тонусі та бути продуктивним.

В наших реаліях карантину та обмежень важко дуже зберігати продуктивність і креатив. Думаю, з цією проблемою стикається, наразі, майже кожен. Мені розібратися в собі та менеджменті своїх ресурсів допомогла ця книга Максима Дорофєєва “Джедайські техніки”. Окрім цього, можу просто порадити шукати свої “джерела внутрішніх ресурсів”, іншими словами — натхнення. Для мене особисто — це перебування на природі якомога далі від шумного міста, а також музичні інструменти.

Дякуємо Дмитру за цікаву розмову та будемо чекати на його виступ. А у наступних статтях ми опублікуємо інтерв’ю з іншими спікерами, тож знайомтесь та приєднуйтесь до Data Science fwdays‘20. Участь у конференції безкоштовна за попередньою реєстрацією :)

--

--

Fwdays
Fwdays

Written by Fwdays

We organize large conferences (JS, PHP, .NET, Highload, etc.) and meetups

No responses yet