大数据驱动的自然语言理解、问答和翻译

浏览次数

6

收藏次数

0

接洽次数

0

项目摘要:语言是人类交流思想、表达情感最直接、方便、自然的一种方式,而人类知识和经验是以各种语言和多种形式(文字、语音等)记载的。以便捷的自然语言形式实现人机之间的自由交互,成为人类的一种共同愿望。大数据和人工智能技术的快速发展为实现这种愿望提供了可能,但同时向自然语言理解、机器翻译和自动问答等关键技术提出了新的挑战。面对这一挑战,不仅需要从大数据角度建立自然语言理解和知识共享的理论体系,而且需要针对民族和语言发展不平衡、口语交互场景复杂、个性化需求和用户意图难以把握等现实问题,进行重点攻关和突破。本项目的研究目标为:面向实用系统开发提出一套大数据驱动的自然语言处理理论和方法,研究融合常识知识和多语言语义关联的知识图谱构建方法,实现旅游、娱乐、体育和客服等公共生活领域的高鲁棒性和高性能的汉、英、藏、蒙、维多语言语音识别、口语理解和翻译、对话管理及自动问答技术,为实现多语言智能问答系统提供关键技术支撑。借助阿里云平台建立可供展示的面向公共生活服务领域的高水平多语言人机对话系统。