数据显示,COVID 错误信息是 Twitter 观鸟计划面临的最大挑战

自 10 月 6 日起,Twitter 上的 Birdwatch 社区审核计划已扩大到包括所有美国用户。

对于 2021 年 1 月正式推出测试版的 Birdwatch 来说,这是一个巨大的进步,代表了该平台遏制错误信息在平台上传播的努力向前迈进了一步。 但是随着图表的扩大,数据被修改了 边缘 这表明 Twitter 的错误信息政策已经涵盖了正在检查的最受欢迎的主题,从而引发了有关该计划整体影响的新问题。

从本质上讲,Birdwatch 的承诺是“分散”检查错误信息的过程,将权力交到用户社区而不是技术公司手中。 但事实核查涵盖了广泛的主题,从琐碎且容易揭穿的谣言到可能取决于科学过程中基本不确定性的复杂主张。

“他可以谈论随机出现的互联网好奇心”

在公开声明中,参与该计划的 Twitter 高管专注于做出最简单的决定。 Twitter 产品副总裁 Keith Coleman 上个月在与记者的电话中指出,Birdwatch 的优势在于处理 Twitter 错误信息政策未涵盖的数据,或者不够严重到无法进行内部资源检查的数据。 “他可以谈论突然出现的随机互联网好奇心,” 小发明 科尔曼语录 据他介绍。 “比如说,太空中有一个巨大的虚空吗?或者说这只蝙蝠实际上有人类那么大?”

a: 悬停]: shadow-light-franklin [&>a]:阴影 – 下划线 – 深黑色:[&>a:hover]: 阴影突出黑暗富兰克林:[&>a]: shadow-underline-white md: text-26 “>方法论

我们下载了截至 9 月 20 日的 Birdwatch 数据。 该数据集总共包含 37,741 个观测值,其中 32,731 个是唯一的。

我们使用了 Python 自然语言工具包 用于分析笔记并提取其中出现的最常见的重要单词的库。

为此,我们丢弃了诸如“and”、“however”、“there”、“that”、“about”等连词,并排除了在事实检查生成过程中经常使用的词,例如“tweet”、 “来源”和“关于”。声明、“证据”和“文章”。我们还忽略了 URL 中的单词——Twitter 作为注释正文的一部分包含这些词——并将复数形式简化为单数形式(所以“汽车”算作“汽车”)。

处理后的数据使我们能够很好地概述通常涵盖的主题或使用 Birdwatch 系统添加的上下文。

➡️要自己探索完整数据,您可以 浏览我们的 Birdwatch 笔记交互式数据库.

但该计划测试阶段的案例表明,许多 Birdwatch 用户正试图解决平台上更严重的错误信息问题,并与现有的 Twitter 政策显着重叠。 Twitter 发布的 Birdwatch 数据显示,与 COVID 相关的主题是迄今为止 Birdwatch 笔记中最常见的主题。 此外,几个发布评论推文的账户已被暂停,这表明 Twitter 的内部审查流程发现了内容违规并采取了行动。

作为其更广泛的开源工作的一部分,Twitter 会定期更新 所有 Birdwatch 笔记的数据集 可从项目博客免费下载。 边缘 我们分析了这些数据,并查看了从 2021 年 1 月 22 日到 2022 年 9 月 20 日运行的数据集。使用计算工具进行数据收集和汇总,我们可以深入了解 Birdwatch 笔记的关键主题,这些主题很难从手册中获得审查。

数据显示,Birdwatch 用户花费大量时间查看与 COVID、疫苗接种和政府对大流行的反应有关的推文。 词频列表显示,“COVID”是最受欢迎的主题词,“vaccine”一词在榜单中排名第三。

在这些观察结果中,随着公众对流行病的理解发生变化,通常得到验证的声明类型会随着时间的推移而演变。 2021 年处理虚假账户的推文声称安东尼·福奇博士不知何故 他有个人角色 在制造新的冠状病毒或怀疑疫苗(如果有的话)的安全性和有效性方面。

这段时间的其他 Birdwatch 笔记涉及未经证实或危险的 COVID 治疗方法,例如伊维菌素和羟氯喹。

虽然关于 COVID 的一些更离奇的神话很容易进行事实核查——例如病毒是骗局、大多无害或通过 5G 塔传播的想法——但其他关于传播、严重性和死亡率的说法可能难以明确确定.

例如,随着 2021 年 1 月疫苗的推出,Birdwatch 用户试图为关于疫苗品牌在预防住院与完全预防任何感染方面的有效性的辩论增添背景。 新泽西州州长菲尔·墨菲 唧唧喳喳 强生疫苗的试验数据显示“完全防止住院和死亡”,并引起了一位统计学家的愤怒反应,他将试验数据与仅显示疫苗“66% 效力”的试验数据联系起来。

“这 [tweet] 作者将报告的预防住院和死亡的功效与报告的预防感染的总体功效混淆了,”Birdwatch 注释有益地补充道,参考 彭博社 覆盖范围 这清楚地区分了尺度。

更值得怀疑的是,另一位 Birdwatch 用户试图验证一个被主要新闻媒体广泛报道的说法,使用网站上的博客文章作为引用进行处理。 随着新闻媒体跟随 CDC 报道 omicron 变体 73% 的新感染 截至 2021 年 12 月, 博文 包在我身上 ThePrepared.com 他辩称,这种说法可能源于 CDC 统计模型中的错误。 这篇博文引起了激烈的争论,但如果没有来自更可靠和更仔细的来源的确认,很难判断该注释是帮助了这种情况,还是只是搅乱了局面。

Birdwatch 用户将这些推文评为最难处理的推文。 (通过在创建注释时填写调查表,用户可以根据四个二进制值对推文进行评分,这些二进制值决定了声明的误导性、可信性、有害性和难以验证的程度。) 科学发现的准确和可访问的交流显然是一项具有挑战性的任务,但公共卫生结果取决于突出准确的健康建议并防止不良建议的扩散。 专家一致认为平台 需要强有力、明确和协调的标准 为了解决有关大流行的错误信息,社区驱动的审核似乎不太可能达到这一标准。

尽管 COVID 是 Birdwatch 笔记的主要主题,但它远非唯一。

在词频列表中,“地震”和“预测”排名靠前,因为大量相同措辞的注释被附加到来自虚假声称能够预测世界各地地震的账户的推文中。

没有证据表明可以可靠地预测地震,但地震预测是不准确的 继续上网. Quakeprediction Twitter 帐户在撰写本文时拥有 48,000 名追随者,是最严重的违规者之一,不断发布有关加利福尼亚地震风险上升的预测。 似乎一位 Birdwatch 用户已自行为来自该地震预测账户和其他地震预测账户的 1,300 多条推文附上警示说明,并且每次它们都链接到美国地质调查局的展示它的曝光 科学家没有预测地震.

目前尚不清楚用户为何如此关注地震,但最终结果是,人类审阅者的行为具有讽刺意味,就像一个自动事实检查程序:它在推文中寻找一种模式,并每次都以类似的动作做出回应。

数据还清楚地显示了挑战 2020 年选举结果的持续努力——这一现象一直困扰着许多其他在线平台。

此外,最常见的词表是“特朗普”、“选举”和“拜登”。 包含这些术语的几份说明声称唐纳德特朗普赢得了 2020 年大选,或者相反,失去了乔拜登。 尽管这样的指控很常见,但鉴于有大量证据表明选举舞弊普遍存在,因此很容易核实事实。

乔拜登赢得了选举。 这是一个大谎言,“所以你读了一个附在 鸣叫 经过 白人民族主义者 亚利桑那州参议员温迪·罗杰斯(Wendy Rogers)谎称欺诈发生在人口稠密地区。

“通过邮件进行欺诈几乎是不可能的,而且绝对没有证据表明 2020 年选举的结果是欺诈的结果,”阅读附在该报告中的另一份说明。 虚假推文 艾琳·阿门达里斯·杰克逊(Erin Armendariz Jackson)在德克萨斯州埃尔帕索争夺前贝托·奥罗克(Beto O’Rourke)在国会的席位。

另一位用户简单地写道:“选举没有被操纵。特朗普输了。” 在这一点上,与许多其他情况一样,不能简单地查看原始推文:在空白页面上搜索推文 ID 并显示帐户已被暂停的消息。

虽然 Birdwatch 用户对许多参与 2020 年选举结果的推文发表了评论,但鉴于支持拜登获胜的大量证据,自我评估民意调查认为这些推文最难解决。

鉴于大量被暂停的帐户,很明显 Twitter 的算法或其人工审核团队也发现标记和删除相同内容很容易。

来自@StateofusAll 的推文截图如下:

到目前为止,Birdwatch 的数据显示了一个强大的自愿事实检查员社区,他们试图解决棘手的问题。 但证据也表明,这些志愿者发布的推文类型与 Twitter 当前的错误信息政策已经涵盖的内容有很大程度的重叠,这引发了人们对事实核查笔记是否会产生重大影响的疑问。 (Twitter 声称 Birdwatch 应该与现有的事实检查计划一起添加,而不是任何替代错误信息控制的方法。)

Twitter 表示最初的计划结果看起来不错:该公司声称,看到推文附带的事实检查说明的人是 同意的可能性降低 20-40% 推文的内容比只看到推文的人更容易产生误导。 这是一个有希望的结果,但暗示,这条推文的许多观众仍然被谎言所吸引。

Twitter没有立即回应置评请求。

点击这里查看 浏览我们的 Birdwatch 笔记交互式数据库.


#数据显示COVID #错误信息是 #Twitter #观鸟计划面临的最大挑战

Leave a Comment

Your email address will not be published. Required fields are marked *