回到主页

为什么需要为智能个人助理建设

让私人助理感兴趣的是,Alphabet,亚马逊,微软和Apple都很脆弱,需要你加入。

显然七年前杰夫贝索斯受到了对星际迷航的热爱,他认为亚马逊应该建立一个可以与之交谈的东西,并将你的命令变为行动。现在,亚马逊Alexa正在与来自几乎所有企业庞然大物的越来越多的智能个人助理[1]竞争。Alphabet(拥有Google的公司)拥有Google Home,微软拥有Cortana,Apple当然拥有Siri,这可能是早期最知名的。Viv和Facebook M也是有趣的竞争者,但每个人的比赛状态都不同,我们最终将覆盖他们。如果你问这些公司中的任何一家有关这项努力的投资,他们会说数字助理是下一件大事。

虽然四大巨头中的每一个都拥有自己的实体产品,但Google Home和Echo Dot之间并不存在争斗 - 他们需要成功的是他们的操作系统。微软在这场竞赛中的优势在于拥有我们通过鼠标与计算机交互的第一个最流行的方式。拥有最受欢迎的助手操作系统可以帮助这些公司定义下一个十年。

无论这些组织在每个产品中投入的数百万英镑和工作时间,他们有一个共同点:这不够。还没有,不是为了一个崇高的目标,即拥有一个可以理解你所说的任何东西的程序,并按照你的意愿去做。

这并不是说这些计划不是令人难以置信的令人印象深刻的技术前沿步骤。然而,像CNN这样的商业内幕比较评论非常清楚,过多地询问这些程序会很快发现他们做不了多少。

问题是我们对计算机有很多期待。如果我的手机拒绝更新我的社交媒体,下载视频,发送和接收来自多个帐户的电子邮件,显示我过去几年拍摄的每张照片(无论我拿了什么设备),我都会感到非常愤怒,并告诉我灰熊的最高速度[2]。此功能已成为该设备的同义词,但手机制造商负责相对较小的一部分。我们习惯于使用多年建立的协议来支持各种软件的平台。现在,每个试图建立世界AI的公司都遇到了两个核心问题:

他们正在构建一个全新的平台。智能助手与现有的操作系​​统不同,他们需要在重建现有连接时投入更多工作

以前,程序有一定的余地可以迂腐。在某种程度上,我们接受不按正确按钮是我们的错。我们在讲话时没有同样的耐心,所以这些程序必须能够回应人们可能会说的几乎任何事情。

苹果曾经将iPhone 6的多压力触摸描述为“ 试图阅读思维 ”,但实际上,技术一直是关于阅读趋势和教学思想 - 一系列增量调整,我们有责任让消费者适应。这里的挑战是重建几十年的程序集成,并作为一个小型项目,编纂整个口语人类语言。

它无法完成。当然不是由一个团队而且,让我们面对现实,如果你正在与苹果公司竞争建立奇怪的科学,你会打赌自己单独做吗?

让私人助理感兴趣的是,Alphabet,亚马逊,微软和Apple都很脆弱,需要你加入。他们在这方面下了很多赌注,他们都不想成为Betamax。或Zune。

每月从您的收件箱中获取Distilled的最佳内容

Email address...
你的机会
几乎没有涉及图形设计,竞争远远低于他们在各自的应用程序商店中找到的。

这就是你进入的地方。为了让这些公司中的任何一家赢得这场比赛,他们需要个人和公司为他们开发很多程序,或者至少是程序特定的集成。

你现在的选择是你是否投入时间来获得利润,知道大多数人会欢迎它,但你也打赌他们的成功。

与设计标准应用程序相比,许多简单功能的时间和培训投资大大减少。没有涉及设计,竞争远低于您在任何相应的应用商店中找到的。作为概念的证明,在2月之前没有编码知识,我正在构建一个可以与一堆消息传递平台以及Google Home和Alexa集成的交互式程序(稍后将详细介绍)。

与其他领域相比,这里的公司也更加开放。亚马逊正在运行免费的半天训练营,以教授建立Alexa技能的原则,并为成功的尝试提供过多的奖励和奖励。Alphabet 建议你如果用户询问您的程序可以实现的某些东西 - 公司会在浏览器中杀死的那种相关的单结果搜索所有权。正在利用这些平台的公司已经获得了回报,例如,由于他们的聊天机器人策略,第一批货物已经在Amazon Echo上预装了JustEat技能 - 这是用户手动下载的竞争对手程序的巨大优势。更重要的是,很多这些新的生态系统都使用参与度指标作为排名计划的一种方式,所以从现在开始并在竞争对手开始之前建立这些数字,公司可以在事情变得更加拥挤时大大提高他们的机会。

如何建立聊天机器人
不出所料,你需要做的最大的改变就是用短语取代按钮点击。四大中的每一个都开始倡导平台,承担识别句子(口头或书面)的负担,打破它,并以易消化的块发送重要信息。你只需要告诉他们什么是重要的,什么时候(我在这篇帖子的底部包含了这些平台的列表)。

总的来说,以下有意广泛的说明将为您在任何这些平台上创建会话应用程序提供服务,因为它们都有一些共同点。这将让您了解需要考虑与它们进行交互的方式。在接下来的几个月里,我将写一篇关于如何使用api.ai平台创建机器人的更深入的帖子,该平台是去年收购的。

计划您的互动
一旦您对平台有了感觉,这将会更容易,但是当您的程序在幕后执行操作时,您几乎需要一个与标记对话的流程图。亚马逊产品宣传员David Low表示,评级最低的应用通常有太多选择。他建议稍微开始并稍后添加选项。

始终计划您的互动,以了解对话将如何发挥作用。

决定你希望别人打电话给你的程序
这是过程中最“SEO”的一部分,最适用于口头交互。基本上这就是人们需要说出来唤醒你的程序。想想“好的谷歌我想和Superdry Online谈谈”或“Alexa,请多米诺骨牌给我订一个12英寸的披萨”。它有点笨拙而不是理想但它意味着你知道你得到了什么,而不是偶然在Facebook上发布你的Spotify密码。

通常,一旦您发布您的程序,更改您的调用为时已晚,因此您需要提前考虑简短,难忘和描述性的内容。如果您的品牌名称已经勾选了这些框,那么如果您拥有像'Pinkr'或'seetbk'这样的web2.0名称,则可能会遇到问题。平台容易混淆同音异义词,您可能需要直接与公司联系以克服这种混乱。他们愿意与个别品牌合作以管理适当的品牌认知,这是此时机会的一个标志。

创建您希望程序响应的短语并突出显示变量信息
在所有这些平台上,您可以创建包含不会更改的部分的短语,然后您还可以添加将要更改的部分。例如,短语“我的名字是Slim Shady ”的格式为“我的名字是{ name }”。这意味着您可以使用这些平台处理繁重的语音变化,并减轻任何外部代码的负担。

处理它发送给你的JSON
首先要做的事情 - 在某些情况下你根本不需要编码,它只会限制你的机器人可以做的事情。我 使用没有外部代码在大约十分钟内在这个gif中创建了简单的来回。如果您具有编码经验或对学习感到满意,那么如果您能够在大约5-8秒内安全地接收并响应JSON POST请求,则可以集成几乎任何这些服务。

测试并上线
大多数服务提供了一些开箱即用的简单集成。他们经常会引导您完成它,如果您只需要一个相对标准的设置,这可能会花费您二十分钟。

然后,您通常需要通过一个稍微单独的过程来实际发布,主要是针对特定介质的质量检查。

幸运的是,像api.ai和converse.ai这样的平台允许一次集成到多个媒体。因此,在为Google Home构建之后,您可以以相对较少的开销推出到Facebook,Slack,Telegram等。

未来五年
如果你只能为一个平台构建并且你正在尝试优先考虑,那么你就不会走得太远。微软的语言处理平台LUIS与流行的Microsoft Bot框架集成在一起,该框架在过去的六个月中几乎使开发人员的使用量增加了两倍,并且远远超过了Cortana。这是JustEat和Three用于跨多种媒介构建的框架,包括网站集成。值得注意的是,Cortana的消费者使用数据可能会大幅膨胀,具体取决于微软是否包括使用Windows 10搜索栏,但是,他们也使用这些搜索栏输入来完善其后端机器学习平台,这应该有助于改善所有应用的准确性。

Alphabet推荐的平台 - API.AI易于上传,只需点击几下即可在多种主流聊天媒体上启动。Alphabet还可以在很大程度上依赖他们的谷歌搜索引擎,以帮助他们的助手更加全面运作,并从中获得用户的吸引力。与Alexa不同,用户无需手动选择要在其设备上安装的机器人,这有助于用户访问您的服务,但这意味着个人请求更像是网络搜索,而不是使用专门选择的应用程序。每次用户说“嗨谷歌”并且早日进入Google智能助理建议的计划将是一个巨大的胜利,而不是一次性安装竞争。

苹果似乎是他们的开发工具包SiriKit背后最远的,仅限于Siri已经可以做的事情。话虽这么说,苹果在智能手机硬件和操作系统方面的主导地位是一个强大的立足点。苹果激光专注于他们自己的生态系统可能会阻碍长期计划成为每个人的HAL 9000,但在短期内,那些致力于Apple愿景的人已经成为最接近消费者的人,他们拥有一台无所不知的机器,可以随时跟随您。

Facebook M,Facebook的智能个人助理是一个有趣的背离常规。Facebook的产品更像是局部自动化,而不是试图创建一个可以做任何事情的程序。Facebook M旨在处理尽可能多的查询,就像其他IPA一样,但是当它被卡住时,将请求发送给调用DMV的人类客户服务代表。这个想法是这些代表所做的一切都被记录下来,因此Facebook M最终可以独自完成。虽然目前仅适用于有限的地理位置,并且可能遇到一些严重的可扩展性问题,但Facebook M有可能在更短的时间内提供他们所有人都在努力的客户体验。

Viv是另一个值得提及的IPA。Viv是由最初建造Siri的团队创建的。联合创始人Dag Kittlaus 在发布视频中解释说,Viv接收请求,检查它拥有的所有集成,然后编写完成请求所需的代码。虽然他们的开发人员中心尚未广泛使用,但您可以通过电子邮件向他们发送关于合作关系的信息,这种不同的设置应该意味着该平台更容易构建服务。

对于我的钱,亚马逊正在制定最有趣的战略决策。他们正在积极地向程序员和品牌求助,并且明确地将程序Alexa与运行它的Echo设备分开。亚马逊对Alexa使用的自由放任态度意味着CES 2017将Alexa包括在汽车和洗衣机以及指向Echo竞争对手的设备上。他们甚至设法通过将Alexa作为功​​能添加到亚马逊应用程序中来将Alexa潜入iPhone,许多用户已经安装了该应用程序。这不能与只是按下按钮召唤Siri的轻松竞争,但它是苹果公司自己的助手的弓箭。亚马逊表示他们认为数字助理应该能够互相使用,这一点特别有趣 - 如果一项服务成为主导,一个很好的理想和突破平台孤岛的绝佳方式。

很可能所有这些球员都太大而无法完全脱离比赛,但如果他们中的一个能够达到临界质量的开发者和用户成为事实上无实体的声音,那将会变得非常有趣。对那些有远见或敏捷的企业来说尤其有价值。

资源
平台特定资源
微软正在推动LUIS与微软Bot框架相结合,谷歌投资了api.ai,亚马逊建议使用developer.amazon.com中专用的部分来构建Alexa技能。亚马逊还在aws.amazon.com上为您的外部代码提供免费(最多一点)托管- 缺点是亚马逊平台更依赖于代码,但它们使链接更容易。苹果给出了关于诗丽吉,他们的SDK专门为Siri的建成,信息在这里。

API.AI中的示例JSON
这与所有平台将发送的消息不同,但这是您可以期待的事情:

{“id”:“9962fb04-3808-472e-9fe0-f34de1f029b7”,
“timestamp”:“2017-06-26T17:27:48.156Z”,
“lang”:“en”,
“result”:{
“source” :“agent”,
“resolvedQuery”:“我的名字是Slim Shady”,
“action”:“”,
“actionIncomplete”:false,
“parameters”:{“name”:“Slim Shady”},
“contexts”:[ ],“
元数据”:{
“intentId”: “2c7ba931-5ea7-4693-B384-eea23a661c68”,
“webhookUsed”: “假”,
“webhookForSlotFillingUsed”: “假”,
“intentName”: “我的名字是名字”} ,
“履行”:{
“演讲”:“”,
“消息”:[{
“type”:0,
“speech”:“”}]},
“得分”:1},
“状态”:{“代码”: 200,“errorType”:“成功”},
“sessionId”:“1b0e0d9a-0efb-4d48-9dfc-9a1d5ebf1364”}

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的