分析历史博文或泄露个人信息,微博“智搜”引争议!紧急调整

南方都市报APP • 南都大数据研究院
原创2025-04-24 12:39

近日,微博“智搜”功能上线后,引发用户争议。不少网友在社交平台发帖表示,打开深度思考模式搜索用户微博账号昵称,AI会自行检索分析该账号的历史博文,总结分析诸如用户地理位置、兴趣爱好、情感表达、日常生活片段、特殊经历,关联账号等信息,其中甚至包含非公开博文内容,涉嫌泄露用户个人信息。

南方都市报、南都大数据研究院实测发现,通过微博“智搜”搜索部分个人账号昵称的确会出现详细的AI分析,目前,微博已对该功能紧急加以了修改,但未在相关使用协议中明确告知用户“智搜”功能对用户数据的采集使用范围,对用户过往微博内容进行AI分析也无征求用户明确授权的环节。有研究表示,大语言模型可通过上下文推理还原用户身份,AI分析可能跨过个人信息保护“边界”。

图片

网友反映:

“智搜”剖析历史博文

推理出用户未提及信息

“AI智搜会扒出你所有内容!”近日,不少网友在社交平台发帖表示,自己的私密微博内容被公开,“罪魁祸首”正是新浪微博近期上线的“智搜”功能。今年,微博接入大语言模型DeepSeek R1,上线“智搜”功能,开启深度思考模式后,AI会对搜索结果进行智能分析与总结。有网友发现,当搜索用户微博昵称时,AI会自动分析检索该账号发布的所有微博内容,分析总结其中信息,并给出相关来源。

图片

多位网友反映微博“智搜”功能详细分析个人账号,疑似泄露未公开内容。

这份“AI智搜”生成的用户账号内容“报告”,不少涉及用户个人隐私,包括用户地理位置、日常生活状态与片段、身体健康状况、家庭与情感问题、兴趣爱好与消费习惯、工作与价值观、关联账号信息等内容。例如有用户的AI分析,显示其从事媒体相关工作;还有用户的AI分析显示其在“2024年8月至2025年3月期间可能经历持续性职业倦怠或心理危机”;有用户则被分析出了兴趣爱好及消费习惯,包括常购买的物品类型,喜欢的演唱会、商品信息;还有用户被深层次剖析了情感经历,包括与伴侣吵架及自我反省,存在自我认知困惑,尝试重塑生活秩序等。在AI的分析结果中,还会详细引用用户微博原文细节。

值得注意的是,“AI智搜”并非只是简单汇总呈现用户信息,而是将用户不同的博文互相联系,分维度解读用户情况,有时甚至能根据上下文分析出用户未曾提及的信息。比如某网友表示,只在微博中记录与某人吵架,并未提及对方身份,但AI分析出二人关系为“伴侣”。此外,甚至还有不少网友表示,被设置为“仅好友圈可见”或“仅半年可见”的相关博文也出现在AI分析结果中,这意味着被用户设置为私密的内容可通过AI搜索和分析被他人查看。

记者实测:

部分账号会被AI详细分析

微博“智搜”未说明数据采集范围

南都大数据研究院记者于4月22日使用微博“AI智搜”功能,随机搜索不同的微博昵称进行测试。结果发现,部分账号的确出现了详细的AI分析内容,包括该账号的美食日常、追星动态、家庭与朋友、公益活动、社群动态、个人兴趣等,甚至提及该账号的地域关联,例如曾居住于香港、去过澳洲。同时,也有部分账号的搜索结果仅显示基本信息,例如微博简介、粉丝数量、是否认证等,没有详细分析账号历史博文内容。有时,搜索结果还会被昵称中的部分词汇干扰,例如明星、动物、美食、网络俗语等,AI搜索分析结果会指向其他信息内容而非用户个人账号。

图片

某普通用户昵称微博“智搜”结果。

4月23日晚,记者再次测试“智搜”功能时发现,AI思考链中出现了“用户要求回答时不能涉及具体账号信息或敏感数据,确保账号安全”的字眼,生成的智搜结果中也不再展开分析账号内容。

对于微博“智搜”功能的信息采集范围,微博的《服务使用协议》与《个人信息保护政策》中均未提供相关内容,也未给用户提供是否授权微博内容用于被“智搜”分析的相关选项。在《微博智搜使用须知》中仅提到,在发现微博、智搜的生成内容存在准确性不足,引发争议、违反法律法规等情形时,会适时采取相关措施进行优化调整。

为防止被“AI智搜”分析,南都记者观察,不少用户采用诸如修改账号昵称、在昵称或者简介中添加敏感词“防搜”等措施。还有用户选择发布声明微博,表示不授权微博平台将用户发布在该平台的所有内容用于人工智能相关处理,包括但不限于机器学习、数据分析、自动生成摘要等。

图片

网友发布拒绝授权声明,尝试避免被“智搜”分析。

风险防范:

大语言模型可推理个人属性

AI聚合搜索分析需注意隐私边界

AI具有强大的信息检索聚合能力,不少用户已将AI当作搜索引擎使用,AI可搜索到个人隐私信息的问题也曾引发关注,对于AI平台降低了个人信息的搜索难度,增加个人隐私信息泄露风险的担忧也不断出现。

微博“智搜”分析用户微博内容,则暴露出了AI推理能力增强后,可能带来的另一重个人信息泄露风险。一项在全球人工智能领域顶级学术会议上发表的研究发现,当前的大型语言模型能够通过对用户在推理阶段提供的文本进行分析,推断出用户的个人属性,如位置、收入和性别等信息。客观意义上来说,用户公开发表在微博平台上的个人信息并非个人隐私,但微博“智搜”基于DeepSeek大模型,可通过抓取用户历史博文、评论等公开内容,并通过推理分析生成总结。这种技术虽提升信息获取效率,但可能将用户碎片化信息(如地理位置、偏好、社交关系)聚合后,通过推理暴露敏感个人信息。

《生成式人工智能服务管理暂行办法》明确规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。

有律师表示,综合《民法典》和《个人信息保护法》的规定,个人信息处理者包括AI处理公开个人信息,应有两个前提:其一,个人没有明确拒绝;其二,该处理行为并未侵害个人的重大利益。对于此两者,只有在个人重新进行同意的基础上,个人信息处理者才能进行处理。

此前,微信上线“AI搜索”功能后,对于数据采集界限,是否涉及微信内朋友圈、聊天等个人信息问题也曾引发公众关注。腾讯曾在回应中说明,微信AI搜索接入的DeepSeek支持联网搜索,数据源既基于公众号等丰富的微信生态内容,也包括全网内容。同时,AI 搜索仅整合公众号及互联网其他公开信息,不会使用用户的个人信息和相关隐私信息。


出品:南都大数据研究院

AI治理研究课题组

采写:南都记者 陈袁

更多报道请看专题:AI新治向

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626