第 2 节
作者:辣椒王      更新:2021-02-26 22:16      字数:5293
  索。或者是Help;帮助,这也挺有意思的。因为我们想要做一点事情,我在Word里我想知道怎么把一个表格一分为二?这句话现在是要人经过把这句话转换成图形用户界面来做它,但是人可能不知道怎么转换,但是当你不知道的时候,你就会打开Help(帮助),然后就问它,把这几个字打进去问它。所以这两个是非常合理地把自然语言处理的方法放进Windows平台里面,能够更好地支持搜索,能够更好地支持对用户的帮助。
  我们非常实际地务实地一步一步来,在这两个 Speech for Telephone and Typing with Searching Help的方向呢,我们一步一步地来,把用户界面一步做得比另一步更好。但是我们的第一步,如果用户用完以后,并不觉得有自然用户界面,或自然语言处理的功能,我们并不沮丧,只要他认为说这个Search(搜索)越做越好,我们就挺开心的。我们再一步一步地往下做下去,另外我们并不是一个认为自然用户界面将取代图形用户界面。虽然在电话上你没有图形,那当然是可以取代的,但是在PC上面其实更合理的是应该用自然语言的方法,自然用户界面的方法,来辅助已存的图形用户界面,因为人们还是更习惯地用图形用户界面,他们不希望看到一个革命性的彻底的一个新的功能,或者一个新的用户界面。
  第三,这个基础我们是用来做的,所以这一整套系统我们是重新开发的。我回到美国总部之后呢,我们就在的基础上用Visual Studio(可视化控件)来帮助我们的Developer (开发人员),能够把已存的应用软件加入语音的功能,加入自然用户界面的功能。我们在 Framework(架构)上开发这一整套系统,我们利用XML Web Service(XML Web服务)能够让不同的系统能够彼此沟通。所以对我们的用户界面是非常需要的一个低层的支持和技术,因为可以在多种的设备上使用,所以我们也认为经过我们可以在电话、电视机、汽车、 电器上都可以使用我们的自然的用户界面。所以我们怎么走这条路呢。
  第一在Telephony上,就像我们刚才所说的,Text Speech(语音合成)、Speech Recognition(语音识别)、Dialogue(对话)也就是说人机对话的沟通,在PC上我们要做搜索,要做帮助。再下一步 Q&A(问与答),我有任何的一个问题我问你,你给我你的答案,这个问题可能是说我明天开会在什么地方,也可能是问一个比如说百科全书的问题,比尔盖茨财富到底有多少?我们能不能有一天做出这样的Q&A(问与答)的系统,这是一步一步来的,从左是时间的开始,到右边是未来的方向,那么刚开始你可以看到语音跟文字是分开的,但将来我会经过多通道用户界面,在任何的机器上它都可以支持语音手写体或者是打字输入,也可以从这些已有的这些功能,左边的这些功能做到Delegation; Delegation就是委托式的用户界面,也就是说我们用户我希望告诉我的PC,不是一步一步怎么做一件事情,而是最后我要得到什么样的结果,而我聪明的PC会帮我计划一步一步地完成它。还有Federation(联盟),就是说,我要求我的PC做一件事情,它不会做,但是它知道别的PC,或者别的Web Service(Web服务)可以做,它可以经过我委托它,它再委托别人去帮我做这件事情。再下一步Collective Agent(集中式代理),这个 Agent(代理)用户界面就是说不是我做用户来启动每一件事情,而是计算机可以主动地说,发生了什么什么事,你要不要怎么怎么做。比如说微软的股票超过四十块了,要不要卖,这个不见得是我人去主动地要求的,而是我很早地要求我得力的计算机助手帮我留意着微软的股票超到某一个程度,就要买或者要卖。当然把这个做好还需要Planning,也就是计划方面的工作。
  我们举一些例子,用语音怎么做呢?打电话买一百股微软,好买了,这就是语音的一个对话。Dialogue(对话)我可以说买微软的股票,它会说要买多少股,我说一百股,这就是一个对话;我讲一句它讲一句,我讲一句,轮流的。从语音的角度来看呢,我们认为Smart Device(智能设备)跟语音是有非常大的关系的,因为今天我们可以把所有的设备分成这两个轴,从y的轴我们看到的是基本上是说它的Screen,它的显示器有多好。从x轴来说呢,我们说它的输入,比如说键盘或者鼠标有多好。当然PC是在右上方的,因为它有很大的Screen(屏幕),又有Keyboard(键盘); 又有Mouse(鼠标),电话是最差的,因为它又没有Screen(屏幕)又没有Keyboard(键盘)。其实呢,还有很多其他的设备,这些设备包括Tablet PC,PDA(个人数字助理);Screen Phone(可视电话),汽车或者TV,这些市场今天都比较小,但是很重要的是在下八年,到2010年的时候我们会看到的是 Screen Phone(可视电话) 和PDA(个人数字助理) 会越来越大。更多的汽车也会变成有计算的功能,也可以上网。更多的电视也会有计算的功能,也可以上网,而Tablet PC会成为更主流的技术。也就是说,有更多的平台,有更多设备的平台,上面是急需语音的一个输入的一个方法。我们在左下方,也就是说Screen(屏幕)非常糟的情况之下,那么语音呢,就可以不要理会它的 Screen(屏幕),我们直接语音对语音地(来)做一个对话。当你有一个小小的 Screen(屏幕)的时候,我们也许可以用(语音)的输入,而用图形的输出。所谓的 Multi Model(多模式),或者mmnd and Control( 命令和控制),当我们Screen(屏幕)够大的时候,这个时候我就可以做听写了,因为听写需要做修改,修改的工作需要一个比较大的一个显示。所以上面的这些机器呢,比如说Tablet PC和语音的听写,是一个很好的结合,所以这几个是语音的很好的机会,那么下面我将做几个语音方面的演示。
  第一个演示,我现在要打电话到美国,这是我们微软公司用SALT技术在用技术和SALT技术做出来的一套系统,这套系统呢,我们将在中国的Visual Studio(可视化控件) 的比赛让中国的学生甚至比美国的学生更先能够有机会用到这方面的技术。在这个演示里面,你们会听到的是有一个很聪明的电脑代理,他会跟我有一段对话,那么我要他做一件事,它会做一件事,这套系统呢,是用Visual Studio(可视化控件)开发出来的,然后微软提供了很DialogueModule(对话模块),也就是说,开发者他编一个语音的系统。
  410155543
  您好;需要帮助吗?
  请帮我处理一下学院基金。
  给我申请表。
  您需要我把信以邮寄的方式还是Email的方式给您?
  Email。
  我已经把信发到您的Email里了。您需要我们找个业务代表帮助您填申请表吗?
  是的;谢谢。
  谢谢;我们马上就会与您联系。您有一封来自银行方面的告警信;您需要我们把它传给您吗?
  好的。
  请稍等。
  艾伦;您好!您有三笔帐单未付。首先是电费 43。5;长途话费 62。25;
  DSL 31。52;您愿意付帐单吗?
  付电费和长途话费。
  电费和长途话费将在两天内交清;您还需要别的服务吗?
  不用;谢谢。
  请说“是”或“不是”或提出要求。您还需要别的服务吗?
  不是。
  这就是我们的演示。在这个演示里你听到的是,我打电话到我的股票经纪商,那么我要求他,我希望理解怎么样去存钱,为了我的小孩的未来的教育,然后他就问了我很多话,最后决定把一些信息寄到我的Email Address里边。这个时候正好我的银行的有很多新的帐单要付,他就把我转换到另外一个部门。这个时候就有一位女士的声音出来,和我做了一个交谈,我决定把一些帐单付清了,另外一些帐单呢,还没有付清,这是这样的一个未来可以做到的一个交流的过程。我们预期这个产品应该在今年可以做完,所以在明年我们就可以看到很多的应用,让人们能更快地把一个已有的  Application(应用),加上语音。这个应用本来是在PC上在Web上应用的,它突然就可以帮你接电话了。
  好,下面我要做的是一个另外的语音方面的演示。我们刚刚所说的语音呢,它有语音合成,还有语音识别。现在我要演示的是微软亚洲研究院的一个工作,大家都知道在亚洲研究院,语音是一个重点研究的项目。现在我要演示的呢,是一个语音合成。这套语音合成系统它最特殊的地方是,第一它非常的自然,第二它能够中文和英文混着说,而且是用同一个语音来说。让我们听听这个声音离人的声音还有多大的距离。
  2003年2月27日,新一代软件技术展望大会在京召开,微软CEO兼CSA比尔盖茨先生将亲临现场与中国大学生面对面,盖茨先生将为微软亚洲研究院主办的微软杯XML Web Service(XML Web服务)学生软件开发大赛获奖团队颁奖,并做题目为Digital Decade(数字十年)的主题演讲。
  好,谢谢。这个技术我们非常的自豪,我估计它的中文已经超过了我的中文的能力了,不过我的英文还比它好一点。
  再下面我们所要看到的是我们在总部最近拍的一个 Video(录像)。也就是说,我们把一些技术,我们已做好的技术,在一些日常的环境上让大家更能理解语音它不是一个很玄的技术,是真的每天任何的一个人都有可能用到的。
  欢迎致电(自动化处方服务)。 请说您的名字。
  简·赛门。
  请输入或说出您的个人标识号或者密码。
  Connecticut
  欢迎,赛门夫人。 您需要重新填写还是修改您的处方?
  修改。
  您共有两个处方,您希望修改哪一个?
  Claro
  您的Claro处方将在一个小时内准备好。
  太好了。
  您今天还需要别的什么服务吗?
  是的。给我丈夫的手机打电话让他过来取处方。
  正在通知他。
  3月15日(周五)下午16: 15,811直达航班离开,3月19日(周二)下午13:30 831直达航班返回。您需要我现在就预定航班吗?
  对,预定航班。
  谢谢,我们将把您的电话转到旅游高级会员业务部门以便让您确认。
  您好。我的名字是迈克。您前往拉斯维加斯的航班已经按照您的意思预定好了。因为您是我们的高级会员,我们将给您一个特殊的折扣价,及包括晚餐和演出在内的娱乐服务,需要我更详尽地为您解释吗?
  呼叫我的秘书。
  欢迎到来,您说您的密码。 123。
  欢迎您,泰乐萨。需要帮助吗?
  为我的部门安排一次会议。
  请告诉参加会议的名单。
  有Rack Sherman(人名); Christine Constant (人名)和Mary Louise(人名)。
  请告诉会议的主题。
  我们与约翰逊公司的合同。
  请告诉会议的地点
  在我办公室里
  请告诉会议的时间
  本周四下午2:00,会议将持续一个小时。
  Christine(人名)在会议日程上有冲突。
  无论如何请给他一个邀请,并告诉他这是紧急会议。回头再与我确认是否所有的参加者都能参加会议。
  还有什么别的我可以为您效劳吗?
  请查一下我的收件箱。
  您有四封信,其中有一封是急件。
  念给我听。
  泰乐萨先生。
  您好,这里是您的自动秘书,所有要求参加会议的人员都接受了邀请。
  太好了
  让我们求助于网络。
  Bridge 大街16号发生火灾。
  告诉我们具体情形。
  -最新的报告是,最严重的火灾破坏是再房间的西北角,在烟囱周围。这与火灾假设的起因相吻合。我的建议是接受这个声明。
  把别的照片发给火警报告中心,让火警报告中心的财产损失小组估算火灾损失,并通过Email给房主一个拷贝。
  我可以为你效劳吗?
  您好,这里是金融自动提醒服务,您是Mary Anderson(人名)吗?
  是的
  请说出或输入四位个人标识代码。
  5489
  谢谢。您付给了Atlantic(公司名)的代码为6233的帐单后将使您的帐户余额为负,需要我们激活您的帐户透支业务吗?
  不用,查一下我市场帐户的余额。
  您的市场帐户的余额为14862。70美元。
  从市场帐户转帐100