账户在此期间未发送任何推文或

请务必记住,如果没有任何信号,则我们会将帐户视为垃圾邮件/机器人/不活跃/宣传。帐户需要7-10+ 这些信号的组合才能算作“假”。以下是  的这些信号的累积情况: 72% 的账户已超过 120 天处于不活动状态(即该转发) 3% 的用户已处于非活动状态 90-120 天 3% 的用户在过去 90 天内创建了账户 36% 使用 Twitter 的默认个人资料图片 39% 使用包含垃圾邮件单词+模式的显示名称 92% 的人要么没有在个人资料中使用 URL。

要么使用了带有垃圾邮件模

式的 URL 60% 不使用可识别位置 27% 的人将自己 日本电讯数据库 的语言设置为英语以外的语言 54% 的人一年多来只发过几条推文 3% 的人每天发送大量推文 96% 的榜单很少(或没有)被列入 79% 的粉丝数量异常少 76% 的人关注的账户数量异常 74% 的人在个人资料描述中使用与垃圾邮件相关的关键字 我有一种不祥的预感,有人肯定会指出这些信号之一,并说“但这并不意味着该帐户是垃圾邮件/机器人/宣传/不活跃的!”所以让我再说一遍:没有一个、两个、三个甚至六个信号意味着我们会将帐户视为低质量。

们对抽样方法感到非常

但是,我认为我们都同意(并且基于垃圾邮 英国电子邮件列表 件+机器人帐户构建的机器学习模型也会同意)一个帐户可以同时具有 7-10 个以上上述信号的组合,并且仍然是一个真实的、活跃的、定期登录其 Twitter 帐户的人,这种情况非常罕见。这并非不可能,只是可能性极小。 总结 对于我们这些虚假粉丝工具的创造者来说,估算数字是 57.1%(从 2,000 名样本粉丝中抽样),而总数是 61.0%(从全部 5,400 万粉丝中抽样),这一事实让我满意。

Leave a comment

Your email address will not be published. Required fields are marked *