AI辅具能让我们更有尊严地老去吗？“中国版霍金”这样说

南方都市报APP • AI前哨站

原创2020-10-23 18:50

10月22日，由中国计算机学会（CCF）主办的2020年中国计算机大会在北京开幕。

当天一大早，CCF杰出会员、中国科学院心理研究所副研究员王甦菁就开着他的代步车，风风火火地赶到了现场。今年，他组织了一场主题为“人工智能+辅具”的专题技术论坛。

辅具，指的是可以帮助老年人、伤病人、残障人士补偿身体功能障碍的器具，比如拐杖、轮椅等。

这是中国计算机大会举办十三年来，罕见的以无障碍技术为主题的技术论坛。论坛的来源与王甦菁的日常息息相关：被媒体称为“中国版霍金”的他，出生时就不幸脑瘫，衣食住行都离不开辅具，最了解残障人士对辅具的需求与期望。

2012年实施的《无障碍环境建设条例》曾提出，国家鼓励、支持采用无障碍通用设计的技术和产品，推进残疾人专用的无障碍技术和产品的开发、应用和推广。

更重要的是，中国的人口老龄化程度正在不断加深，可能在2022年左右正式进入老龄社会。老去的过程势必伴随身体功能的退化甚至丧失，未来，对辅具有需求的老年人也会越来越多。

有感于社会的变化，王甦菁特意邀请了多位人工智能与辅具领域的专家，在论坛上展开探讨。

论坛现场。

清华大学计算机系副研究员喻纯和浙江大学教授、中国残疾人信息和无障碍技术研究中心副主任卜佳俊，分别从软硬件的角度切入，介绍了他们研发的助盲技术。

有数据显示，中国的视障人群数量超过1700万。网络购物、追剧、看新闻等普通人习以为常的事，对盲人而言却困难重重。以验证码输入为例，许多读屏软件只能识别网页上的文本，无法识别验证码图片上的内容，这使得盲人在账号登录环节就被卡住。

清华大学计算机系副研究员喻纯介绍了一种智能交互代理系统，能帮助盲人更好地使用手机应用。

喻纯解释说，读屏软件对第三方应用信息的读取，依赖于应用开发者的配合——为应用内的各个模块添加相应的标签和文本标注。但是当前的第三方应用参差不齐，应用内的前后景控件和层级不分，也缺乏标注。此外，现在的应用内都会有大量图片，读屏软件很难读取到图片内的信息。

“谈到智能交互，我们有几个目标。第一个是信息获取不能有障碍，应用界面上所有的控件层级、交互语义信息都能识别。第二个是交互方便，表达自然，支持语音、手势等新的输入方式。”喻纯说，智能交互代理系统已基本实现了这些目标，而且盲人用户只要安装相应的App、贴上辅助“屏保膜”就可以，不用对原有的手机和应用进行过多改造。

在现实生活中，很多盲人需要双手操作手机：一只手拿手机，一只手摸屏幕。但盲人外出时往往还需要一只手来拿盲杖或牵引导盲犬，这样的操作显然很不方便。喻纯与团队还开发了一种基于电容屏图像分析的“耳朵识别”智能算法，让盲人可以用耳朵在手机上执行按压、触摸浏览等操作。

盲人想自如的生活，还少不了外力的帮助。浙江大学教授、中国残疾人信息和无障碍技术研究中心副主任卜佳俊介绍，目前的助盲技术系统主要有三类，第一类是传统导盲技术系统，比如盲杖；第二类是侵入式的视觉辅助技术，比如通过脑机接口为盲人加装“仿生眼”；第三类是非侵入式视觉辅助系统技术，比如超声波导盲眼镜或头箍。

在卜佳俊看来，第一类技术系统使用场景有限、无法充分满足盲人需求，第二类技术系统所使用的技术尚未完全成熟，具有较高的风险和成本。相较而言，第三类是更加方便、现实、安全的选择。因此，从2019年开始，他带领团队投入了智能助盲眼镜的研发。

经过一年多的研发，智能助盲眼镜已基本成型，集成障碍物检测、交通标志检测、人脸识别、文本识别、语音交互等一系列针对盲人生活“痛点”的功能。

以交通标志检测为例，智能助盲眼镜能够识别与盲人出行关系最为密切的20种交通标志，包括斑马线、无障碍坡道、交通信号灯，等等。卜佳俊介绍，为了解决交通标志尺度变化大、背景复杂导致的检测识别准确率低、速度慢等问题，团队研发了一种基于深度学习的新算法。

值得注意的是，智能助盲眼镜还加入了熟人识别、表情识别等人脸识别功能。如果迎面而来的是亲友，眼镜就会像佩戴者发出提醒，并且提示对方的表情。卜佳俊说，从实验来看，熟人识别和表情识别的精度分别能达到99.7%和85%。

研发完成后，团队招募了15名盲人志愿者进行试用。卜佳俊说，志愿者者的总体反馈还不错。“用户提出的反馈意见与建议，也为产品的迭代和后续研发提供了很好的参考方向。”他说，产品研发完成后不断扩大用户体验规模，在功能优化的同时，还可以提供更多的能力去服务各类残疾人。

除了帮助残障人士解决生活困难的智能辅具，也有一种类型是帮助健全人更顺畅地与残障人士交流。

中国科学技术大学信息学院教授周文罡介绍了视频手语识别的研究。他们希望让机器学会看手语，当聋哑人士对着摄像头比手语时，机器可以同步地将手语识别出来，并转为口语化的表达。

为了达到这个目标，周文罡首先要让机器学看手语词，但这并不容易。在中国，常用手语词大概有5600个，这些词可以组合出非常复杂的句子。此外，手语跟方言有相似性，不同地区、不同个体的手语习惯不一样；手语视频往往存在两手之间互相遮挡、背景干扰等问题，这些都对机器识别造成了挑战。

就此，周文罡提出，可以利用手的先验模型，生成手部的3D骨架数据，再通过推理模型识别手语词。“比如说，尽管人眼看到的是个二维的手型，但是你可以推测出对应三维的手长什么样子。”在团队的测试中，手语识别效果已经有了不错的改善。

北京保益互动科技发展有限公司创始人曹军则以盲人的身份，针对无障碍技术设计提出了一些建议。

曹军回忆，有一次，他在某个机场试用无障碍电梯，却发现电梯的盲文在很低的位置，他需要蹲下来才能摸到。从他的亲身体验看，像这样为残障人士设计、但实际上并不好用的产品还有很多。

曹军说，这些产品的设计初衷都是好的，但开发者对用户需求的想象和判断，不一定符合残障人士的真实需要，用户用起来不一定方便。在现实中，开发者往往在产品成型后才邀请残障人士参与测试，“这个时候就晚了 ”。“你们要做产品的，一定要跟我们交朋友，先了解了我们的需求，再去设计产品，这样的产品一定会被社会所认可，一定能够真正改变残障人士的生活方式。”

“人工智能加辅具的研究，给我们的无障碍建设带来了更好的机遇。”在圆桌环节，中国残联副主席吕世明说道。他表示，产学研各方关注残障人士的需求和愿望是非常好的事，“就怕大家不关注、不研究”。但正如曹军说的一样，研究者有必要将用户体验环节前置，在研发初始阶段就践行“无障碍设计”理念，找准用户需求，避免走弯路。

“以前有一个说法是，发达国家在关注20%的（弱势）人群，发展中国家在关注80%的人群。为什么我们现在说国家强大了，其实我能感觉到，国家的关注点正在从80%的人群向20%的人群转移，越来越关心残疾人、老年人等一些特殊人群。”中国残疾人信息和无障碍技术研究中心主任助理王炜说，“人工智能、大数据等前沿技术，可能会在特殊人群的帮助上发挥更大的作用。”

曹军也表达了类似的观点。他举例说，随着时代的变化，盲人也借助辅具用上了智能手机、电脑。他相信，技术的发展会进一步改善残障人士的生活水平。“或许5年以后，我们就能借助科技的力量看到这个社会了。”

采写：南都记者冯群星潘颖欣

编辑：李玲

南都新闻，未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626

本文作者

李玲: 3.67亿

南方都市报记者

“AI老师”合格吗？放心吗？AI学习机你怎么看

01:06

霍启山来佛山“撑西甲”，直言赛事能让更多年轻人关注足球

00:43

中考作文题“我与我们”怎么写？听听他们怎么说

01:25

AI会取代仲裁员吗？这位来自广州仲裁委的代表这样说
时局快报