两个月前,微软宣布取消Windows 和设备部门——曾经为微软贡献四分之一营收的标志性产品团队,取而代之的是,分设成体验与设备和云计算与人工智能两个事业部。
郭昱廷作为这次改组挪腾中的一员,前不久刚从沈向洋领头的微软人工智能与研究事业部调往云计算与人工智能部,担任全球高级副总裁。采访中,郭昱廷多次强调,这样的调整是为展现微软拥抱云计算和人工智能的决心,并非放弃 Windows。
这里提到的微软的决心究竟意味着什么?
对于覆盖了全球十余万名员工的庞大组织而言,微软一直保持着每三年一次的组织更迭节奏,而近三年,自纳德拉上任后,所有的努力都在为向人工智能和云计算的核心靠拢。
2016 年 9 月,微软将技术与研发部门和人工智能 (AI) 研究部门相合并,组建新的微软人工智能与研究事业部(Microsoft AI and Research Group),由微软全球执行副总裁、技术与研发部门主管沈向洋领头。
2017 年 7 月,微软裁员 3000 名员工,削减其他部门开支,并加强微软云计算部门(Azure)。今年,「云计算与人工智能」部门的设定意味更为明显。微软也变得更聚焦了。
而在一系列的组织与业务重组的背后,是微软将近 20 年的顶尖研究院资源——自上世纪 90 年代创立之初将就人工智能定位核心研究方向,这些技术积淀和研究成果亟待产品化,当下的人工智能时代机遇将是最好的窗口。
从西雅图到北京
微软全球执行副总裁沈向洋发表演讲
继月初的 Build 2018 大会召开 12 天后,微软将Intelligent Cloud and Intelligent Edge的新愿景从西雅图搬到了北京。
当天会场内聚集了 1000 名开发者,在线观看者达 15 万人次——这是微软首次在国内举办的如此大规模的人工智能主题大会。
沈向洋携一众高管激情演讲,包括微软技术院士黄学东、微软云计算与人工智能事业部全球高级副总裁郭昱廷、微软 (亚洲) 互联网工程院副院长李笛等,全面展示了微软在智能云计算与智能边缘计算领域的最新技术、资源服务以及合作部署。
尽管部分技术成果在 Build 大会已有所介绍,但面向中国市场,微软还是带来了值得期待的本土化的产品。交互式人工智能是微软所倡导的方向之一,在 Azure 上顺势也成为了最为重要的智能应用,不仅包括微软姐妹花小冰、小娜在语音交互以及情感沟通方面的进步,还包括诸多商务场景的升级,如 AI 会议系统的全武功演示、无人机搭载计算机视觉模块勘测管线情况的应用。
在行业应用市场,智能客服需求最为旺盛。微软大中华区副总裁兼市场营销及运营总经理康容在接受极客公园采访时谈到,基本上所有的企业都对这个服务表示出兴趣。比如在金融行业,客户都提出了对于数字化客户的需求。倒不是并不是要完全取代人,遇到棘手问题还是会由人工接管,目的在于更系统性地获取客户数据。
此外,康容提到,在微软面向行业应用市场的一系列AI+云解决方案中,首当其冲的将是制造业、新零售以及金融行业、医疗。
很多工厂客户在利用机器学习针对生产计划进行预测,减少他们流水线的延误,提升效率,康容介绍。
而对于中国如今大热的新零售板块,尤其是本着业务协同的考量阿里云正在发力的阶段。康容表示,无论新旧,本质都是零售。我们的观察是传统行业向数字化转型的动力都很足,不然活不下去了。所以这块的业务我们十分重视。
康容还提到,在医疗领域对于数据在线化和结构化的苛求也异常强烈。目前微软亚洲研究院已经和制药企业辉瑞公司达成合作,推进疾病知识图谱和诊断问答系统的建立。
透过沈向洋当天的演讲内容,我们可以看到,在微软云计算的业务矩阵中,公有云、混合云、物联网(Azure IoT Edge)、Azure Sphere被视为当下的四大核心。
公有云毋庸置疑一直是云计算业务的基础,而兼具公有云和私有云的混合云业务方案正逐步成为更具灵活性的市场趋势。Azure IoT Edge 则是微软今年面向端智能,即边缘计算提出的重点业务模型。
今年,微软宣布将开源 Azure IoT Edge 资源,让开发者能够对边缘应用进行修改、调试,进行扩展、添加功能,部署到 Linux 和 Windows 等多种环境中,并让开发者拥有对端设备更高的透明度和控制能力。
作为示范性合作案例之一,微软宣布和大疆在无人机行业应用领域的合作与探索,包括农业、建筑行业、公共安全等场景,以及具体解决方案 FarmBeats 的推出。
此外,在 Azure IoT Edge 上,微软与高通合作推出了定制化视觉服务,能够让无人机或其它工业装备无需连接到云端就能做出快速响应。
Azure Sphere,则是微软考虑到物联网安全与联网议题所提出的工业级物联网解决方案,包括经过特殊设计的安全芯片、安全操作系统和云端安全。
尤其在芯片层,微软开发了全新级别的微控单元(MCUs),性能是旧款 MCU 的五倍,采用特别为 IoT 而优化的 Linux 内核,并使用了基于云的安全服务。
这些设计将免费授权给合作的厂商,而首个采用这一解决方案的厂商为联发科——第一个 Azure Sphere 芯片 MT3620 由联发科公司开发,预计将于 2018 年第三季度公开发售。
沈向洋表示,目前,每年全球有 90 亿片微控制器被安装到各种机器中——从家用电器到工厂设备,但只有 1% 具有联网功能,Azure Sphere 力图打开这一市场。
在智能云计算的主题下,认知服务是微软重点发力的业务板块,同时也是微软研究院和人工智能团队研究成果的集中展现。
微软云计算与人工智能事业部全球资深副总裁郭昱廷介绍微软认知服务
微软认知服务在三年前的 Build 大会上正式推出,主要以 API 的形式为开发者提供 AI 能力,覆盖语音、视觉、语言、机器翻译、OCR 识别等 24 项服务,其中 17 项已经商用。如今,已经有 100 万开发者使用了该项服务。
现场演示环节中,OCR 光学识别图形文字、手写文字,Captionbot.ai 的 AI 图片识别后的自动文字描述功能,以及 Visual Studio Tool for AI(以下简称 VS for AI)的视觉模型定制化功能等,都让现场开发者十分惊喜,掌声不断。
其中,VS for AI 的功能实现方式是,开发者只需要上传一组图片,然后导入标签,随后系统就会自动生成一个定制化的机器学习模型。这和谷歌云李飞飞团队在今年初推出的 Cloud AutoML 有着异曲同工之处。
对此,郭昱廷接受采访时表示,这套产品背后的逻辑是微软云面向客户的定制化服务思想,早在两年前端的 Customer Service 中微软就已经推出了 Pre-train 的服务。原因在于,很多客户在具体的使用场景中需要匹配度更高的模型,但同时他们还不具备人工智能深层次的技术能力,所以微软云顺势推出了定制化服务。
包括语音服务、视觉服务,微软都是采用这个定制化的逻辑。郭昱廷说道。
在视觉领域外,微软在其核心技术优势——语音层面的技术积淀已经不用赘述。因为前不久谷歌在 I/O 大会中引用首个全双工技术宣传而不服的微软,在这次大会中也抛出了底气十足的开源计划——在今年秋季,将向中国和日本的合作伙伴和开发者开放全双工语音感官技术(Full Duplex)。
这其中包括语音唤醒、群聊识别(基本身份与声纹)、控制器应答、多轮对话记忆等四层技术结构,开发者可将这种对话方式融入自己开发的应用中去。
2016 年 8 月,微软(亚洲)互联网工程院通过人类用户主动发起的方式,与小冰进行了一场人机对话,如今微软已让小冰与人类用户完成了累计超过 60 万通电话交流。