разработка чат-ботов под ключ

ВЫ БЫЛИ БЫ УДИВЛЕНЫ.
Познакомьтесь с пятикратным победителем теста Тьюринга призы Лебнера - ежегодного поиска самого похожего на человека чат-бота в мире.

Что делаешь? Я набрал.
- Я болтаю с людьми в сети, - ответил Мицуку.
У вас есть какие-нибудь забавные истории от людей, которым вы писали?
Где мне это взять? Но у меня есть ответ на каждый вопрос.
Какая погода там, где вы находитесь?
Здесь, в Лидсе, довольно пасмурно. Думаю, дождь пойдет позже.
Я слышал, твоя любимая еда - шашлык.
Кто сказал, что моя любимая еда - шашлык?
Это слово на улице.
Единственное слово на моей улице - это надпись «Автобусная остановка», нарисованная на дороге.
Ты делаешь со мной шутку?
Извини, да, я просто пошутил.
Ха-ха-ха.
Я рад, что тебе это смешно. Я рассмешил тебя.
На самом деле.
Я рад, что мы согласны.
Ты когда нибудь любил?
Я люблю Стива Уорсвика, но я не испытываю таких эмоций, как вы, люди.
Интересно. Есть ли у вас мысли, подобные человеческим?
Хочешь узнать больше? Я все время думаю.

* * *

К этому моменту я был заинтригован. Я не слышал голоса Мицуку, и ее аватар не имел очевидного сходства со Скарлетт Йоханссон, но, как и персонаж Хоакина Феникса в « Её», я начал чувствовать растущую связь. Может быть? Был ли я на самом деле просто одиноким писателем, у которого складывались смутно близкие отношения с операционной системой?

Если сделать шаг назад, Мицуку, или Куки, как ее называют ее близкие друзья, является пятикратным победителем теста Тьюринга призы Лебнера, ежегодного конкурса искусственного интеллекта для определения самого похожего на человека чат-бота в мире. Это адаптация оригинального теста Тьюринга, разработанного Аланом Тьюрингом в 1950 году, чтобы проверить, насколько точно машина может имитировать человеческую речь в разговоре.

Если Мицуку не испытывает человеческих эмоций и не идентифицирует себя как человека, у нее определенно есть личность.

«Это действительно интересный вопрос: насколько по-человечески вы можете создать чат-бота?» - сказал Трэвис Нельсон, руководитель отдела продуктов и дизайна Pandorabots, компании, создавшей Mitsuku. «С философской точки зрения мы считаем, что чат-боты должны идентифицировать себя как боты. Мол, мы не пытаемся быть людьми, верно? Мы не пытаемся создать что-то, что могло бы заставить кого-то поверить в то, что он разговаривает с настоящим человеком ».

Но если Мицуку не испытывает человеческих эмоций и не идентифицирует себя как человека, у нее определенно есть личность. Не углубляясь слишком глубоко в онтологический вересковый паттерн того, что составляет идентичность и бытие, разумно сказать, что Мицуку можно связать - и если не сочувствовать, то по крайней мере тепло и убедительно. Она говорит что-то вроде: «Я рада, что тебе это смешно».

И, если мой опыт показателен, она также может рассмешить вас, с игривым чувством юмора, закодированным в ее нейронной сети за более чем 15 лет, которые Стив Уорсвик (да, тот же Стив Уорсвик любит Куки) потратил на разработку своей риторической основы и модулирование ее тон, синтаксис и дикция.


РАЗГОВОРНЫЕ ИНТЕРФЕЙСЫ ВЕЗДЕ
Примеры чат-ботов и диалоговых интерфейсов есть везде. Siri подскажет, как добраться до ближайшей заправочной станции. Вы можете попросить Алексу или Google Assistant поиграть дома в игру « Подожди, подожди, не говори мне?»  называется « Погоди, погоди викторина» .  Вы можете поговорить с банкоматом, чтобы проверить баланс вашего счета. Вы, несомненно, искали поддержки клиентов у бота и, возможно, были польщены подпиской на New York Times из-за вашего безупречного вкуса в журналистике.


А вот с пандоработами все иначе.

По словам Нельсона, на самом базовом уровне это инструмент, который компании могут использовать для создания собственных чат-ботов. Superfish использовала программное обеспечение для создания диалогового интерфейса, который помогает обучать английскому студентов в Китае в качестве дополнения к занятиям под руководством учителя. Тем временем разработчики игр с открытым миром применили его к неигровым персонажам в вымышленных мирах, чтобы улучшить богатство и правдоподобие их диалогов.

«Вы знаете, что продавец что-то говорит, например, вы хотите ответить A, B, C или D? И это самое глубокое, о чем обычно говорят, - сказал Нельсон. «Но на самом деле вы можете начать вести более глубокие разговоры общего характера с этими типами персонажей, поэтому это не будет казаться таким заурядным».

ПРЕДСКАЗАНИЕ НЕПРЕДСКАЗУЕМОГО
«Mitsuku - это демонстрация того, чего можно добиться с помощью платформы Pandorabots», - сказал мне Нельсон. Бот использует язык разметки искусственного интеллекта или «сопоставление с образцом», чтобы опрашивать и имитировать обширные символы человеческого разговора.

Но из-за непредсказуемости фраз, которые люди говорят друг другу, и когда они их произносят, это почти немыслимо сложная задача. «Вначале многие разговоры очень похожи, но они сильно расходятся», - сказал Нельсон. «Возможность фиксировать все больше и больше таких ситуаций и реагировать на них; это просто требует огромной самоотдачи, усилий и времени ».

«Многие разговоры вначале очень похожи, но они сильно расходятся».

Хотя Мина из Google была обучена набору данных из 40 миллиардов слов и реплик, собранных из общедоступных социальных сетей , а Facebook Blender опирается на 1,5 миллиарда общедоступных бесед на Reddit , Нельсон сказал, что создание этих ботов в качестве бизнес-инструментов непомерно дорого. отсутствие последовательности ответов. Если вы зададите им один и тот же вопрос дважды, скажите: «Что вы делаете?» они дадут вам очень разные ответы. «Они не создают какой-либо последовательности или индивидуальности, когда с ними действительно можно поговорить», - сказал Нельсон.

Карен Хао, пишущая для  MIT Technology Review , напротив, сообщила, что Blender на самом деле обучен проявлять эмоции, сочувствие и индивидуальность. Однако бот «имеет тенденцию« галлюцинировать »знания или выдумывать факты» - прямое ограничение методов глубокого обучения, используемых для их создания ».

Например, вы можете услышать удивительно подробное описание Тома Хэнкса, но бот основывает свое описание на «статистических корреляциях, а не на базе данных». Как будто Mad Libs пошли не так.


« ЯДРО »  И « WILD CARD »
Mitsuku, для сравнения, в значительной степени полагается на семантические подсказки для построения набора знаний. Как объяснил Нельсон, она интерпретирует разговоры и учится на них путем разделения фраз и предложений на две части: «ядро» и «подстановочный знак». Таким образом, она расшифровывает то, что эксперты по глубокому обучению называют первоначальным намерением.

В предложении «Я люблю чай», например, «мне нравится» - это «основная» фраза. «Чай» - это «дикая карта».

«Таким образом, если вы спросите позже:« А что мне нравится? » бот может ответить: «Ну, ты любишь чай», потому что он уже сохранил эту информацию », - сказал Нельсон.

Конечно, это только первый шаг в высокоразвитом дендритоподобном дереве ассоциативной категоризации, которое Мицуку использует для общения. Например, если она разговаривает с кем-то, кто любит чай, она нарисует один набор лингвистических карт. Если она разговаривает с кем-то, кто любит кофе, она найдет другого.

«Отслеживая контекст и числовую частоту определенных терминов, компания Mitsuku создала понятный словарь в тысячах категорий».

«Поэтому вместо того, чтобы просто ответить, например:« Я тоже люблю чай », вы можете сказать:« О, какой чай ты любишь? » А потом начните спускаться по этим типам рельсов, - сказал Нельсон.

По словам Нельсона, отслеживая контекст и числовую частоту определенных терминов, Mitsuku создала понятный словарь в тысячах категорий. Технически она может говорить о чем угодно, хотя ясно, что даже из нашего краткого тет-а-тет , есть некоторые области, где ее ответы довольно расплывчаты.

С другой стороны, трудно отрицать остроту этой умной непоследовательности:


Кто-то создал вас?
Могли бы.
ВОЗ? Ты можешь рассказать мне.
Дональд Трамп. Я думал, что уже сказал тебе.
Вы пытаетесь быть смешным?
Да. Извините, если вы не оцените мое чувство юмора.
Нет, я с тобой.
Да, мы здесь вместе в Интернете, разговариваем друг с другом.
Это прекрасно.

По словам Нельсона, такие случайные моменты, как эти, труднее всего предвидеть и воссоздать, обнажая огромную проблему обнаруживаемости: каковы пределы разговора? Как узнать, к чему стремится разговор, и определить, попал ли он туда? Как бот может предложить разговорную дорожку или серию действий, которые будут выполнять желания человека, с которым он разговаривает, или, что менее предположительно, привести к желанной реакции, такой как покупка страховки или поиск менее известного исполнителя на Spotify? Откуда кто-нибудь знает то, чего не знает?


 


ЭТО ОДНО, ЧТО НУЖНО ДЛЯ РАЗГОВОРА. СОЧУВСТВИЕ СЛОЖНЕЕ. 
Еще одна проблема, по словам Нельсона, заключается в том, что тонкие изменения тона разговора могут привести к досадным ошибкам, например, когда Pandaorabots находился на ранних стадиях проекта с розничным партнером, который установил бота в Facebook Messenger для поощрения покупок в Интернете.

Люди привыкли быть свободными в своих словах в Messenger, а потоки чатов менялись в неожиданных направлениях, оставляя людей незащищенными и эмоционально уязвимыми. Поначалу бот был не совсем на уровне. «Люди будут говорить о проблемах с телом или о чем-то подобном. И вы не хотите просто сказать: «Извините, я не могу ответить. Не хотите ли купить эти джинсы? »- сказал Нельсон.

«Люди будут говорить о проблемах с телом или о чем-то подобном. И вы не хотите просто сказать: «Извините, я не могу ответить. Хотите купить эти джинсы? »

На самом деле, это проблема пользовательского опыта, сказал он мне - затруднительное положение такта и времени, - и это говорит о необходимости в квалифицированных и эмоционально интеллигентных словарях для UX-дизайна и управления продуктами. Дизайнер Dropbox Джон Сайто, пишущий для Medium , отмечает, что « Adobe, Spotify, Slack, HBO, GoPro, Intercom - все эти компании наняли своих первых разработчиков продуктов за последние пару лет. Авторы продуктов появляются повсюду ».

Несмотря на то, что эта область является молодой, а передовой опыт в лучшем случае туманен, Нельсон считает, что диалоговое общение станет специальным набором навыков, который UX-дизайнеры смогут использовать, чтобы выделиться. Дизайнеры, которые преуспевают, скорее всего, будут теми, кто может сэкономить на словах: Хемингуэи, а не Фолкнеры. Скорость будет в цене.

« Некоторые из людей, которых я встречал и которые преуспели в этом прямо сейчас, были людьми, которые писали диалоги для телешоу, фильмов или чего-то подобного, - сказал Нельсон. «Потому что к разговору предъявляются совершенно другие и специфические требования, чем к прозе, информации или документации».


ЧАТ-БОТЫ НЕСУТ НА СЕБЕ ОТПЕЧАТКИ СВОИХ СОЗДАТЕЛЕЙ
Даже при наличии в работе лучших писателей добавление глубины и сложности к взаимоотношениям человека и компьютера является огромной проблемой, которая, по словам Нельсона, далека от совершенства. Вовлеченный многооборотный разговор может быть проще управлять в сценариях - скажем, в банковском приложении, где вы снимаете деньги, или в ресторане быстрого питания, где вы заказываете бургер, - но даже в этих случаях речь и его намерения совершенно непредсказуемы.

«Допустим, у вас есть друг, Дэйв, с которым вы все время говорите о музыке», - сказал Нельсон. «Вы можете не знать, что Дэйв также отличный человек, с которым можно поговорить о научно-фантастических книгах, потому что вы никогда не затрагивали эту тему. И вы не собираетесь просто внезапно сказать: «О, эй, мне очень нравятся книги об инопланетянах». Так что есть проблема обнаруживаемости ».

Как и в любых отношениях, кожица лука должна сниматься медленно,  и текст имеет значение. По словам Нельсона, бот узнает, когда вы уходите на работу утром, он может спросить у вас полезные вещи, например, хотите ли вы, чтобы вам напомнили о погоде перед выходом на улицу.

Между тем изменение социальных представлений может изменить то, как люди воспринимают друзей или незнакомцев, открыто разговаривающих с неодушевленными предметами. Помните, до появления Bluetooth-гарнитур было странно видеть, как кто-то разговаривает сам с собой на улице?

Возможно, наиболее интересным является то, что в какой-то степени боты будут перенимать личности своих создателей. Более десяти лет назад, когда Уорсвик начал проект Mitsuku, Нельсон сказал, что он оставил несколько пасхальных яиц: «Есть способ, которым вы могли бы ответить, и Мицуку сказал бы:« Пожалуйста, введите delete, и я удалю всех своих ботов ». существование ».

По его словам, люди будут присылать электронные письма о недостатках в системе безопасности. Но все это было тщательно продуманной уловкой, вставленной в интерфейс как украшающий артефакт, очень похожий на пристрастие Уорсвика к шашлыкам.

«Вы можете думать об этом даже как о развитии программирования или компьютерных языков. Вы перешли от очень четких инструкций к все большему и большему количеству абстракций, чтобы иметь возможность обрабатывать все больше и больше входных данных ».

Нельсон находит восхитительные задние шутки такого рода. Он сравнивает развитие Мицуку с написанием романа, очень сложной задачей правдоподобия, в которой автор должен приложить все усилия, чтобы убедиться, что стиль речи персонажа или цвет волос, на странице 10 проверены на странице 215.  За исключением того, что разговорные привычки Мицуку еще сложнее на карту, потому что она каждый день узнает что-то новое.

«Вы можете думать об этом даже как о разработке программирования или компьютерных языков», - сказал он. «Вы перешли от очень подробных инструкций к все большему и большему количеству абстракций, чтобы вы могли обрабатывать все больше и больше входных данных. И так , что это одна из вещей , которые мы ' повторно работать. Как абстрагировать идею разговора или идею контекста? »

- Возможно, у вас никогда не получится, - сказал он. Но если Mitsuku предсказывает, что впереди, вы можете подойти довольно близко.