Я посмотрел фильм «Престиж» и понял, что внедрение — это самое важное в работе дата-сайентиста

Обсудить

Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография

Аватар автора

Артем Евстафьев

Страница автора

«Престиж»

Режиссер: Кристофер Нолан

Фильм рассказывает жутковатую историю соперничества двух фокусников, но больше самого сюжета меня поразила философия построения фокуса, описанная в фильме. Каждый фокус состоит из трех частей или действий: наживка, превращение и престиж.

Наживка — это когда фокусник показывает вам обычный предмет — колоду кард или птицу. Второе действие называется превращение: фокусник берет этот обычный предмет и делает с ним что-то необычное. В этот момент вы начинаете искать разгадку, но не торопитесь хлопать, потому что заставить предмет исчезнуть — это еще не всё, его следует вернуть. Вот зачем нужна третья часть номера, самая сложная, часть, которую мы называем престиж.

Увидев все это, я задумался и понял, что мы, дата саентисты, — те же самые фокусники и третья часть фокуса действительно самая важная и сложная. Мы берем что-нибудь достаточно простое и очевидное, например, жалобы клиентов банка за последние три года. После этого делаем с ними что-то необычное, очищаем данные, векторизуем, делим на выборки, строим нейронные сети и ансамбли решающих деревьев и т.п. Но в этот момент наша работа совсем не закончена, и никто не готов нам хлопать. Самое важное — это финальная стадия, когда мы применяем все эти наработки, чтобы предсказать потенциальную жалобу до момента ее возникновения, выявить проблемные места и резко уменьшить количество негатива со стороны клиентов.

Аналогично, если мы проанализировали миллионы кейсов работы с просроченной задолженностью и с помощью изощренных моделей научились предсказывать эффект от любой потенциальной стратегии взыскания, это предсказание само по себе не несет никакой ценности для бизнеса. В конечном счете необходимо будет придумать, как внедрить модели в работу колл центров и хард коллекшн, учесть бюджетные ограничения, количество операторов, время работы с каждым потенциальным кейсом и множество других факторов, чтобы в итоге уменьшить стоимость и увеличить эффективность взыскания.

Именно наличие финальной стадии отличает дата саенс, применимый в бизнесе, от абстрактных академических исследований, которые целиком сосредоточены на 1 и 2 фазах, а зачастую только на 2. В целом успешное внедрение даже не самого лучшего решения, может принести организации и ее клиентам гораздо больше пользы, чем самое совершенное решение, внедренное впопыхах и, по сути, не работающее в большинстве случаев.

Когда я понял эту простую истину я решил, что в целом любой проект нужно начинать с внедрения, хотя бы мысленного. Если отсутствуют эффективные пути внедрения ваших наработок, то возможно проект просто не нужно делать вовсе и стоит потратить время и силы на что-нибудь другое, где мы в итоге сможем удивить наших зрителей и получить заслуженные аплодисменты.


Вот что еще мы писали по этой теме