第43问:人工智能到底可以做哪些事儿?

2022年,ChatGPT的横空出世将人工智能再一次带到了普罗大众的面前,一方面人们对人工智能技术的“真正实力”充满了好奇,另一方面,人们也开始更深刻地认识和思考人工智能对生活和工作的重大影响。

从上个世纪三十年代开始,图灵就提出了人工智能的雏形概念,再到1956年达特茅斯会议,正式确认了人工智能的概念名称和内涵。现今,人工智能已经走过了半个多世纪的历程,但今天我们所谈论的人工智能,在取得了技术上的巨大进步基础之上,还展示出了以下两大典型的发展特征。

1. 人工智能技术的发展特征

第一,人工智能技术正在朝着普适化的趋势发展。

腾讯在《腾讯人工智能白皮书》里提出了一个名称“泛在智能”,指的是人工智能将从仅有少数人了解和使用的高端前沿技术,逐渐朝着大众化、普世化的方向快速发展。这里的“普适化”发展有三个层面含义:

首先,人工智能的技术的使用门槛正在逐步降低。例如,各大互联网公司研发的通用或行业的人工智能算法和模型,现已经具备了快速接入各项业务应用场景的能力。因此,非技术类公司不再需要自行开发或组建人工智能技术团队,也能获得AI技术的赋能。这极大地提升了在数字化产业创新中,对前沿数据科学技术的使用便捷性和经济性。

其次,社会大众对人工智能的普遍认知在不断深化。人工智能相关概念、知识和应用已经被广泛接受,甚至正在融入不同层级的教育体系。未来,了解人工智能,学会如何使用人工智能技术解决日常学习、办公场景需求,提升自身业务能力,将成为当代职场人和受教育者的学习中心。

其三,人工智能正在成为新型数字基建的一部分。人工智能技术具有极强的灵活性和扩展性,同时还能够与其他数字基建技术(如5G、云计算、大数据、物联网等)相互深度融合,共同支撑数字经济时代丰富的产业创新实践。因此,人工智能技术在整个信息科技产业生态中发挥着更加底层的基础作用。

第二,人工智能正在与具体的产业相融合,推动传统产业升级,促进新兴产业发展。

人工智能的产业融合能力,可以从两个维度体现:其一,以机器学习和深度学习为代表的技术,具有很强的通用性,能够在不同的数据集进行训练,从而满足特定的行业的通用业务需求;其二,人工智能大模型能够在业务数据持续增长的基础上,经过动态增量的模型训练和参数微调,加强自身对特定领域业务处理能力的精度和深度,以满足行业中的个性化需求。总之,人工智能一方面可以建立起行业级的通识性技术,满足一般常规的业务需求,又可以通过模型的“自我进化”能力,满足行业用户的偏个性化使用需求。

2. 人工智能的应用场景

基于以上总结的人工智能技术发展趋势,对人工智能技术的应用场景进行总结和归纳,大致包括感知识别、推理决策、内容生成、智能控制等几个主要的应用方向。

感知识别:感知识别是指通过人工智能技术,对业务环境中的信息进行自动感知和分析,从原始的环境信息中提取出关键的业务信息,辅助后续的业务问题深度分析和综合决策判断。类比来看,人工智能技术在感知识别方面的应用,替代了人的耳朵、眼睛、皮肤等感触功能。根据所感知的数据信号类型,感知识别包括语音识别、文本识别、图像识别等。以图像识别为例,人脸识别和文字OCR是两种关键的细分应用场景。

人脸识别是通过机器学习算法来识别和验证个体生物特征的技术。人脸识别技术首先通过图像采集来获取人的面部信息,然后通过预处理技术来提高信息的准确性,比如灰度转换、直方图均衡化、噪声去除等,之后结合人脸检测、特征提取和人脸信息匹配等步骤,给出特定的结论反馈——即判断被识别者面部信息与预输入的身份信息是否匹配。

目前,人脸识别技术已经具有十分广泛的应用场景:在安防领域,人脸识别技术用于公共场所和特定机构对访客权限管理,同时判别可疑人员入侵;在身份验证领域,人脸识别技术可以用于设备解锁、金融信息验证等,方便用户快速使用设备、实现无密码交易等;在泛娱乐行业,人脸识别技术可以通过对照片标记、增加面部滤镜等方式,提升在线社交应用的产品趣味性;在管理领域,人脸识别技术可以帮助公司统计员工考勤情况,或协助网课教师统计学生上课出勤情况等。

OCR文字识别(Optical Character Recognition,OCR)是通过深度学习方法,将图像中的文字转化成可以编辑的格式。OCR技术不仅可以识别印刷体文字,还可以识别手写文字,提高信息输入和编辑的效率,减少人工输入文字的重复劳动。

OCR技术拥有丰富的应用领域:在办公场景中,可以利用OCR技术对纸质文档文字识别并进行电子化处理,有助于资料的搜索、编辑和留存;在各类交易场景中,可以利用OCR技术快速读取支票等单据信息,从而提高交易效率,减少交易信息处理的失误风险;在公共场合中,OCR技术可以用于停车场快速识别车牌并收费,从而帮助车辆快速通行;此外,OCR技术还能与智能翻译功能相结合,集成应用到翻译笔等终端设备当中,实现扫描翻译的智能化应用效果。

推理决策:推理决策是指基于系统同步或感知的信息,通过算法模型进行综合分析和推理,对未知的业务属性或业务事件进行预测分析,即从已知数据中整合分析出新的结论,辅助不同行业领域的综合研判和管理决策。类比来看,人工智能技术在推理决策方面的应用,替代了人的大脑思考功能,本质上属于认知智能领域,实现了对不同渠道业务信息的深度理解与综合分析的应用效果。

推理决策可以完全基于数据驱动,也可以融入应用场景的经验知识和业务规则。推理决策类应用通常的表现形式为决策支持系统(Decision Support Systems,DSS)、专家系统(Expert Systems,ES)、风险预警系统、推荐系统等,通过整合不同人工智能算法、数据资源,以及行业模型,实现特定业务问题的智能化服务升级。

内容生成:AIGC(Artificial Intelligence Generated Content)是利用基于生成对抗网络、预训练大模型等技术,基于已有数据资源训练,形成具有内容输出能力的人工智能技术,AIGC生成的内容包括:文字、图片、音视频、代码等,还支持不同类型数据之间的转化效果,比如文生图、文生音频等。

2022年年底,引发全球广泛关注的ChatGPT就是AIGC的典型应用之一,但AIGC的应用范围不仅限于传统的聊天交互形式:在泛娱乐应用方面,AIGC能够用于音视频脚本制作、文案撰写、配音语音生成、文字生成图片等功能场景,还可能用于音乐创作、辅助编曲、声音合成、游戏设计等工作环节的效率提升;在辅助办公方面,AIGC能够用于文稿撰写、长文摘要、PPT等办公软件制作、辅助编程,高效地解决常规性、流程性的内容生成问题,极大地降低工作人员的重复性劳动。

智能控制:智能控制是指基于对环境信息的感知和目标任务的综合理解,智能计算得到相应的行为决策指定,控制机器设备终端自动执行相应的操作。类比来看,人工智能技术在智能控制方面的应用,替代了人的手脚等行为功能。人工智能在智能控制方面的应用形态,几乎都可以归为智能机器人的技术产业范畴。

机器人是人工设计并制造的、具有实体外形的智能体,能够按照事先设定的程序执行特定的任务,从而降低人类重复性、危险性体力劳动。人工智能技术与机器人技术相融合,能够提高机器人的智能化水平,使其应用在更广泛的领域。比如,人工智能技术可以帮助机器人提高行进过程中避障能力、路线优化能力,提升对人类语音、图像等各类型交互信息的识别精度等。

智能机器人目前已经在多个行业领域普及应用:在物流仓储领域,智能机器人能够通过调度算法和高级传感技术来优化定位和路线规划,高效、稳定地完成上货、拣货、补给、退货和盘点等仓储业务;在医疗领域,智能机器人可以在医生控制下进行骨科、胸外科、心内科、神经内科、腹腔外科、泌尿外科的手术,还可以应用在一些可穿戴医疗设备上,帮助病患进行术后的健康恢复;智能机器人还可以表现为无人机、无人汽车等不同细分类型的技术产品形态,大规模、低成本地解决交通、物流、勘察、传媒等诸多传统行业的需求痛点。