Интервью с Михаилом Соколовым | Data Science fwdays’20
Следующий спикер двухдневной бесплатной онлайн-конференции Data Science fwdays’20, который с удовольствием ответил на вопросы для интервью, Михаил Соколов — стратег данных, NLP эксперт и архитектор систем, CTO и соучредитель компании Dex Technologies.
Вступление
Пару лет назад я вызвал первого попавшегося электрика с “Кабанчика” помочь с ремонтом проводки, у нас завязался разговор, в ходе которого я узнал, что пожилой человек в больших очках и с отверткой в руках, находящийся у меня на кухне, имеет два высших образования и в свое время работал на производстве самых передовых технологий электроники СССР. Рассказав немного о себе, он поинтересовался моей профессией. Почему-то первое, что пришло в голову — это ответить, что я айтишник. Когда я рассказал более детально о том, чем я занимаюсь и к чему стремлюсь, он спросил, почему же я позиционирую себя как айтишника, являясь предпринимателем.
Наверное, это был тот момент, когда пришло осознание того, что у каждого в голове есть образ того, кем ты есть и этот образ формируется не всегда осознанно. И с образом “мастера” в голове, как в случае с электриком, можно на протяжении всей карьеры делать действительно классные штуки в одиночку, но только команда способна сделать paradigm shifting, что-то действительно крутое, что может изменить мир к лучшему.
Расскажи о себе. Как пришла идея создать компанию, и какие трудности возникли на этом пути?
Первый заработок в айти, еще в школе, мне приносили ремонты компьютеров и создание веб-приложений. Безусловно, своим базовым навыкам программирования я обязан компьютерным курсам, которые еще в 7-м классе мне предложили обучение по бартеру, в своем роде internship. Освоив несколько языков программирования, сначала помогал друзьям с их интернет-магазином, дорабатывая существующее приложение и написав простую CMS-ку в старших классах школы. Потом был долгий период учебы и работы фрилансером в СНГ, завершающим этапом которого было создание платформы для туризма с нуля для заказчика, куда Runa capital инвестировала около 600 тысяч долларов с оценкой стоимости компании в 3.5 миллиона долларов. С 2014 года начал заниматься фрилансом в англоязычных странах, много путешествуя с женой. Ушел в разработку высоконагруженных и data-rich приложений. Со временем сложность и объем проектов стали достаточно велики, и у меня возникла необходимость собрать команду для работы над новыми проектами.
Создать компанию несложно. Сложно выжить после ее создания. Первые проекты шли непросто: постоянно что-то отваливалось, то с технической стороны, то с человеческой (больше с человеческой). Так сложилось, что дата создания компании почти совпала с днем рождения дочери. И первый родительский опыт был очень близок к первому опыту бизнеса. На работе у нас не было стартового капитала, базы клиентов, каналов продаж и понимания рынка. Дома меня ждал маленький человечек, требующий внимания и любви 24х7. Однако мы точно знали, куда нам интересно развиваться и куда мы хотим прийти. Это был сложный период. Только благодаря сплоченной командной работе нам удалось пройти его.
Проект для правительства США — почему именно эта страна? Могли бы в Украине использовать некоторые из ваших идей, и какие именно, по твоему мнению, были бы для нас актуальны?
Думаю, будет уместно упомянуть, что в Украине у меня был один исследовательский проект с IRTC (Міжнародний науково-навчальний центр інформаційних технологій та систем), однако в силу NDA рассказывать об этом не могу. Из проектов, которые могли бы быть полезны в Украине — это, к примеру, полу-автоматизация судебной системы, которую мы предлагали в Эмиратах недавно. Вообще потенциальных проектов очень много. Но несмотря на наличие нескольких коммерческих успешных проектов в Украине, нам пока не удалось найти точку взаимодействия с кем-то из заинтересованных лиц, а те предложения, которые поступали, имели либо дефицит бюджета, либо бюрократические сложности. В других странах (USA, Canada, UAE) заказчики часто проявляли проактивность и сами выходили на связь, устраняя все препятствия на пути к выполнению задачи.
Большинство наших заказчиков приходили из США, так как это наиболее понятный и инновационный рынок, где нам удалось постепенно от software engineering перейти в machine learning и NLP (говорю “мы”, потому что 100% результатов нашей компании — это результат команды) — собственно к тем направлениям, которыми я занимался долгое время в некоммерческих целях, так как это было моё хобби на протяжении 7-ми лет. Еще во время учебы, с одногруппниками организовали клуб “Интеллект”, во многом вдохновившись семинарами “Образный Компьютер” Шлезингера, поднимали вопросы создания ИИ, когнитивные архитектуры, онтологии, машинное обучение и многое другое.
Было здорово осознавать, что теперь нет необходимости кодить что-то другое в свободное от работы время. Долгое время у меня была мечта прийти к задачам по AGI, и мы пришли к такому проекту из Пало Альто в 2018 году. Именно в нем нам впервые посчастливилось освоить в полной мере large-scale Transformers, с которыми приходилось взаимодействовать практически каждый день, погрузиться в дебри BERT и схожие модели. Мы достигли неплохих показателей в ответах на общие фактоидные вопросы (лучше, Google Assistant и Siri на тот момент) и получили достойный фидбек от ко-фаундера Siri. Но, познакомившись в Пало Альто лично, после некоторых разногласий с сербским заказчиком, нам так и не удалось подписать co-founders agreement, в связи с чем мы решили впоследствии расстаться. Сейчас я рад, что так сложилось, потому что на уровне ценностей у нас были большие расхождения.
Компании, которые ты координируешь, занимаются разными направлениями: ІТ, охрана здоровья, финансы, кибербезопасность, розничная торговля и т.д. Какое из них самое интересное для тебя? И чем именно?
Самое интересное направление для меня часто меняется. Сейчас, к примеру, есть интересное направление с применением трансформеров и reinforcement learning для quantum hedge fund одного из наших партнеров. Думаю, тут есть большой потенциал. Если говорить про направление технологий в целом, вне индустрий, то пересечение NLU и NLG сейчас очень актуальны.
Что ты посоветуешь тому, кто только пришел в NLP? На что обращать внимание вначале карьеры?
Исходя из опыта работы с нашими интернами и джуниорами, самая частая проблема — это эффект Даннинга-Крюгера, которая встречается, наверное, у 40% интернов. Получив самые базовые знания, люди сразу хотят работать над коммерческими проектами и получать кучу денег.
Наверное, также, стоит помнить о том, что даже для очень сложных задач часто существуют простые решения, которые лежат на поверхности. Безусловно, теория важна для понимания механизмов работы инструментов NLP, но только практика может позволить эти инструменты использовать и комбинировать в нужное время. Поэтому я за подход к изучению через “делание”, теорию можно подтянуть в процессе.
Думаю, что самое главное — это держать в голове две вещи: то, чем ты сейчас занимаешься должно быть “for fun”, независимо от всего остального. И второе — это понимание того, где ты хочешь оказаться через год, 5 лет, 10 лет, 20 лет и что ты хочешь после себя оставить на этой планете.
Какие интересные проекты ты и твоя команда в Dex Technologies создаешь сейчас? Над чем работаете?
Сейчас делаем explainable ML для предсказания риска заболеваний Covid-19 по множеству факторов, с учетом активности человека, его географии, и прочего. Есть еще несколько проектов по логистике (Fleet management AI) для оптимизации расхода топлива, маршрутов, соблюдения ПДД и других параметров. Также делаем ресерч и скоро запускаем цикл статей про large-scale transformers моделям, с точки зрения NLU.
О чем будет твой доклад на онлайн-конференции Data Science fwdays’20?
В 2019 году мы решили сделать небольшой стартап на пересечении биомедицины и NLP. За время разработки мы стали свидетелями того, на что способны большие научные сообщества за короткий промежуток времени. Доклад будет как раз про то, какие проблемы сейчас стали способны решить инструменты BioNLP и какие проблемы в самом BioNLP существуют.
Мы благодарим Михаила за такое интересное интервью и ждем его выступление в первый день конференции Data Science fwdays’20–8 августа. Присоединяйтесь, участие бесплатное по предварительной регистрации.