Tags: translation machine-learning physics software-engineering
Categories: None

На Hacker News разгорелась неплохая дискуссия по поводу материала Wired, о том как нас, software инжереров, поработят и лишат куска хлеба злобные физики. Я решил очередной раз поупражняться в переводе, всвязи с чем публикую этот пост-перевод. Итак, “Move Over, Coders—Physicists Will Soon Rule Silicon Valley“.

===

Сейчас плохое время для физиков.

По крайней мере так считает Оскар Бойкин. Он получил степень по физике в Технологическом Институте Джорджии, а в 2002-м получил PhD в Калифорнийском Университете. Но несколько лет назад физики, работавшие с Большим адронным коллайдером в Швейцарии подтвердили существование бозона Хиггса, субатомной частицы, изначально предсказанной в 1960-х. Как отмечает Бойкин, все ожидали этого. Хиггс ничего не изменил в беспорядке теоретических моделей, описывающих вселенную. Это ничего не изменило и не дало физикам никакого другого повода для стремления вперед. “Физики возбуждаются от того, когда что-то не так с физикой, но сейчас мы находимся в такой ситуации, что с физикой не так уж много неправильного,” говорит он. “Это разочаровывающее место для физика.” Кроме того, зарплата не так уж и хороша.

Бойкин уже долгое время не физик. Теперь он Software Engineer в Кремниевой Долине. И сейчас очень хорошее время, чтобы стать одним из них.

Бойкин работает в компании Stripe, 9-и миллиардном стартапе, который помогает бизнесу принимать платежи онлайн. Он помогает строить и управлять программными системами, которые собирают данные об оказанных услугах компании и работает над предсказанием мошеннических транзакций, включая информацию о том кто, где и когда их совершит. Будучи физиком, с присущим им абстрактным мышлением и знанием математики - он идеально подходит для такой работы. К тому же, в отличие от физики, он работает в сфере, которая все еще предлагает бесконечные вызовы и возможности. Кроме того, зарплата отличная.

Если бы физики и инженеры-программисты были субатомными частицами, Крмениевая Долина крутилась бы вокруг места их столкновения. Бойкин в Stripe работает с тремя другими физиками. В декабре, когда General Electric купила ML-стартап Wise.io, говорил об этом как о покупке компании, упакованную физиками, особенно вместе с астрофизиком из Университета Беркли Джошуа Блумом. Открытое ПО в области машинного обучения H20, используемое 70,000-ми специалистами по обработке данных по всему миру было создано физиком Арно Канделом, который в одиночку работал в SLAC National Accelerator Laboratory. Виджай Нарайан, глава направления Data Science в Microsoft - астрофизик и несколько других физиков работают вместе с ним.

Это, конечно не нарочно. “Мы не ходили в детские сады для физиков, чтобы украсть корзины с детьми,” говорит президент и со-основатель Stripe Джон Кллисон. “Это просто произошло.” И это произошло в Клемниевой Долине. Потому что структурно и технологически, те задачи, которые необходимо решать каждой интернет компанией все больше и больше подходят под набор навыков физиков.

Это естественно

Конечно, физики сыграли свою роль в Сomputer Science с первых дней, так же как и во всех других областях. Джон Мочли, один из конструкторов ENIAC, одного из первых компьютеров - был физиком. Денис Ричи, отец языка программирования С - тоже был физиком.

Но сейчас чрезвычайно подходящий момент для физиков в компьютерных технологиях, помогающих подъему машинного обучения, когда машины учатся задачам анализа огромных объемов данных. Это новая волна Data Science и машинного обучения подходит физикам целиком и полностью.

Среди других вещей, индустрия пошла в сторону нейронных сетей, программного обеспечения, которое моделирует структуру человеческого мозга. Но эти нейронные сети - сплошная математика в огромных масштабах, в основном линейная алгебра и теория вероятностей. Специалисты в Computer Science не обязательно должны учиться всем этим вещам, но физики обязаны. “Единственное, новыми вещами для физиков станет - научиться тому как оптимизировать нейронные сети, обучать их, но это относительно просто,” говорит Бойкин. “Одну из техник называют методом Ньютона. Это именно тот Ньютон-физик, а не какой-то другой Ньютон.”

Крис Бишоп, который является главой центра Кембриджской исследовательской лаборатории Microsoft, чувствовал себя также 30 лет назад, когда глубокие нейронные сети только начали показывать результат в академическом мире.
Это то, что привело его из физики в область машинного обучения. “Есть что-то естественное в переходе из физики в машинное обучение,” он говорит, “более естественное, чем в Computer Science.”

Вызов

10 лет назад Бойкин говорил, как много его старых друзей физиков перешли в финансовый мир. Тот вкус математики был очень полезен для Уолл-Стрит как средство для предсказания того куда пойдет рынок. Один из ключевых методов была модель Блека-Шоула, которая определяла стоимость финансового инструмента. Но эта модель способствовала обвалу рынка в 2008-м году. Сейчас Бойкин и другие физики, могут сказать намного больше чем другие коллеги, которые пришли в Data Science из других технологических направлений.

В начале этого десятилетия, физики пришли в топовые технологические компании для создания ПО для обработки больших данных, систем, которые оперируют данными, находящимися на тысячах машин. В Twitter Бойкин разработал систему, называемую Summingbird, а три других парня, с которыми он знаком по кафедре физики в MIT создали похожую систему в рамках стартапа, названного Cloudant. Они знают как обрабатываются данные в MIT, Cloudant обрабатывает потоки данных с Большого Адронного Коллайдера. Для создания таких сложных систем необходимы сильные навыки абстрактного мышления.

В раннем Google, один из ключевых сотрудников создал большую распределенную систему, в инженерном помещении компании. Это был Йонатан Зангер - PhD из Стенфордском Университете, специалист в теории струн. И когда Кевин Скотт присоединился к команде рекламы в Google, он собрал данные со всей компании, и использовал их для предсказания того какая реклама даст наибольшее кол-во кликов. Он нанял большое кол-во физиков. В отличие от других ученых в области Computer Science они больше подходили к очень экспериментальному характеру машинного обучения. “Это было почти как работа в лаборатории,” говорит Скотт, который сейчас является CTO в LinkedIn.

Сейчас обработки больших данных - это обычное дело, Stripe использует открытую версию ПО, которую Бойкин создал в Twitter’е. Это ПО помогает строить предсказания во многих других компаниях. Это дает физикам еще большее широкую дорогу в Кремниевой Долине. В Stripe в команду входя так же Roban Kramer (physics PhD, Columbia), Christian Anderson (physics master’s, Harvard), и Kelley Rivoire (physics bachelor’s, MIT). Они пришли туда, потому что они подходят для этой работы. Из ответа Бойкин: “Зарплаты в технологиях возможно являются абсурдными.” Но это так-же показывакт что надо решать множество сложных проблем.

Будущее

Сегодня физики переходят в компании Кремниевой Долины. Но придет время, когда это феномен распространится более широко. Машинное обучение изменит не только обработку данных, но и способы создания ПО. Нейронные сети уже готовы распознавать изображения, распознавать речь, к машинному переводу и другим естественным интерфейсам. Крис Бишоп (Microsoft) сказал, что software engineering идет от ручного написания кода, основанного на логике, к машинному обучению, основанному на неуверенности и вероятностях. Компании типа Google и Facebook начинают переобучать своих инженеров к новому мышлению. В конце концов остальная часть компьютерного мира пойдет за ними.

Другими словами, все физики разгоняющие эту сферу в Кремниевой Долине являются знаком более крупных изменений, которые нас ждут. Скоро все инженеры Кремниевой Долины пойдут по дороге, протоптанной физиками.

comments powered by Disqus