从历史上看,曾经主流的机器学习技术在行业中应用是统计机器翻译 (smt)。smt 使用先进的统计分析,从一句话中上下文的几个词中来估计最佳可能的翻译。smt 自 20 世纪中期以来的为所有主要翻译服务提供商所使用,其中包括微软。随着基于深度神经网络(nn) 的翻译技术的出现,带动了机器翻译技术的突变,显著提高了翻译质量,这种新的翻译技术在 2016 年的下半年开始大规模部署使用,这使得研究人员们能够创造更流利,自然的翻译。微软的中英翻译 ai 基础方法是双重学习——将中文译成英文,再将英文译回中文来确保翻译结果的准确度,并允许 ai 从自己的错误中学习并改进结果。ai 还会在重复翻译的过程中,根据用户的编辑和修改操作,学会自主编辑和修改翻译结果。这样将保证翻译结果的准确性,语法上也不会再出现颠三倒四的奇怪错误,语句也不再充斥着一股机翻味。在很好地解决准确性之后,研究团队下一波会考虑让 ai 翻译更接近于人类,比如赋予更多抒情性和情景交谈能力。预计当人工智能在翻译领域充分发展之后,将取代大部分新闻、说明、规范文件等的翻译工作。
阅读全文
