你是否曾在约会平台上看到潜在的理想对象时,想知道屏幕另一端到底坐著的是谁?当你们见面时,他们会是一样的样子吗?他们是否为了让自己看起来更令人印象深刻而修改了个人简介?他们喜欢自己所说的那些事物吗?或者……他们根本不存在?
有时,答案是:不存在。
我们发现了一个工具(仍在开发和改进中),它提供了多种功能,能够在几个不同的约会平台上使用,包括创建虚假账户、与受害者互动、绕过
CAPTCHA、使用代理和匿名浏览器工具进行匿名访问等等。作者还在实验著使用 ChatGPT
,这个如今知名的基于文本的生成式
AI,来生成更流畅且可信的文本。因此,我们决定将这个工具命名为 Love-GPT
。
概述
根据我们的数据,这个工具的历史可以追溯到至少十年前。它的功能随时间不断得到改进,添加了随著流行度上升的新约会平台,以及匿名技术和互动方式。该程序包含若干与越南相关的字符串、函数和其他参考,我们推测其作者可能是越南人。
在此博客文章中,我们将描述一个截至 2023 年 6 月 6 日的版本(编译日期),主模块版本为
347。请注意,该工具包含不同的模块:例如,这个主版本包含第 544 版的 账户控制中心
模块。
ChatGPT 的功能可能在 2023 年 3 月份被添加到 Love-GPT 中(可能是 2023-03-30,主模块版本 326)。
我们看到的所有版本都是明确用 VB6
编写的,以表单应用程序的形式提供。历史上,这些模块名称的变体至少在某个时间点存在过:
account_control_center_alive_monitor_START_HERE.exe
pof_reload_monitor.exe
ringtones_runas_launch.exe
ringtones_runas_login.exe
scan_phone.exe
virtualbox_pof_reg_CONTROLER_MONITOR.exe
该工具还需要一些附加应用程序,以使整个工具集正常工作。正如我们将展示的,所有这些都被用来支持对约会平台的匿名访问,使用代理,创建大量虚假账户,获取和发送电子邮件,并与用户互动。
我们可以在下面一窥 Love-GPT的主模块。该模块包含与用户互动的几种功能,包括阅读收件箱(获取回答和电子邮件)、浏览匹配信息(平台用以表达对另一用户兴趣的方式)、发送喜欢的标记、在数据库中存储有效的
Cookie、更改所用的代理等等。还有三个不同的 ChatGPT 按钮,提供 ChatGPT 文本生成的功能。
Love-GPT 的主模块
总的来说,该工具包含 58 种不同的应用表单,而在这篇博客中无法列出和描述所有这些。然而,我们想展示其中一个,因为它对整个工具集至关重要:账户控制中心
模块。
这个模块作为所有支持的约会平台虚假账户创建的主要中心。它还支持从平台抓取照片、下载访问页面的 HTML 内容、使用 PowerTCP
提取
Cookie、使用 Multilogin
、ProxyRental
、Luminati
和 MountProxy
工具进行匿名操作等等。该工具还有一个(较弱的)随机生成器,用于创建新虚假账户的密码,以及从 1000个常见美国名字中随机选择一个。内置的浏览器允许操作员在必要时视觉检查该工具的行为,以及手动在访问页面上进行互动,以防自动化不足。
带有内置浏览器的账户控制中心
请注意,我们在此描述的工具庞大,我们可能遗漏了一些重要的功能方面,或者因为超出了单篇博客的范畴而省略了它们。我们仍在调查程序的某些部分,未来可能会成为后续博客文章的主题。
虚假个人资料和数据收集
数据库
正如我们已经提到的,这个工具的主要目的是在几个约会平台上创建虚假个人资料,并存储或抓取与平台用户的互动数据,包括他们的个人照片、个人资料正文、沟通日期等等。
为了成功达成这一目标,工具使用了三个大型数据库,分别称为 CL Harvest(CL_db_harvest_db
)、pof_db
(即 Plentyof Fish 数据库)和
gmail_db
,以存储大量不同的信息。由于所有数据库是互相交织的,可能是历史原因,我们将从现在开始将其称为单一数据库,以简化分析。
该工具使用 Microsoft SQL Server
作为数据库,并通过程序内部的 SQL Server NativeClient
(提供者SQLNCLI10
)来协调通信。
以作者的默认凭据访问本地数据库的登录界面
储存的信息
目前,数据库结构包含大约 180个不同的数据库表(注意,根据工具的不同版本,数字有所不同)。我们至少想提及其中一些,以提供对所收集或创建数据的有趣见解。我们相信这些表格不需要进一步的描述。
表名 | 说明
—|—
a_02_Okcupid_photo_db_scanned_from_okcupid
|
a_02_Okcupid_photo_db_scanned_from_okcupid_age_group_1
| 年龄组稍后会描述
a_02_okcupid_about_text_db_age_group_3
| 个人资料的 “关于” 描述文本
a_03_zoosk_replied_users
|
a_07_ashley_accounts
|
duyenso_create_fake_profile_current_setting
| DuyenSo 是一个越南约会平台
email_addresses
|
openai_chat_log
|
openai_prompt_1st_contact_msg
|
openai_prompt_ask_for_number
|
openai_prompt_ask_for_number_for_OKCUPID
|
openai_prompt_ask_for_number_INDIRECT_WAY
|
openai_prompt_chat_template
|
openai_prompt_profile_body_text
|
pof_accounts_for_scan_new_users
|
twilio_for_PVA_direct
| PVA 代表 “电话验证账户”
twilio_phone_for_dating_2018
|
twilio_uk_mobile_number_database
|
US_female_firstname_len_5
| “len
” 表示 “长度”
US_male_firstname_len_5
| “len
” 表示 “长度”
仅列举数据库中的一些表名
此外,该工具还将约会平台上的图像保存在几个目录中:
C:\fb_dating_all_avartar_temp\
(请注意拼写错误)C:\fb_photo_set_temp\
C:\PIC for POF\BIG STORE\
C:\twoo_scanned_photo\
E:\FB dating girls photo by city\
F:\5K Female photos by hair color\
E:\temp_okcupid_downloaded_photo\
G:\duyenso_pics_from_pof
G:\duyenso_pics_from_pof_girls\
G:\duyen so acc photo - ready to up - girls\
G:\duyen so acc photo - ready to up - man\
年龄组
该工具将用户分为四个不同的年龄组:
年龄组 | 年龄范围
—|—
1 | 30-37 岁
2 | 37-49 岁
3 | 49-60 岁
无组 | 以上皆不是
这作为一种筛选选择,也显示出作者/操作员感兴趣的年龄范围。我们推测这是因为作者很可能使用被盗信息创建进一步的虚假账户。年龄组可能是设置虚假年龄的关键因素,尤其是在处理照片时。
目标约会平台
截至 2023 年 6 月 6 日,我们识别出该工具与 13 个不同的约会和社交发现平台互动。以下是这些约会平台的列表:
约会平台 | 说明
—|—
Ashley Madison |
Badoo |
Bumble |
Craigslist | 对 “Personal” / “cas” 部分感兴趣 – “休闲约会”
DuyenSo | 越南约会应用程序
Facebook Dating |
likeyou.vn | 越南社交网络和约会平台
MeetMe |
OkCupid |
Plenty of Fish |
Tagged |
Tinder |
Zoosk |
该工具在创建虚假账户的过程中需要完成几个步骤,遵循在平台上注册的流程。这通常涉及通过
CAPTCHA、验证电话号码(PVA)以及创建虚假电子邮件地址、用户名和密码。所有这些步骤都是由工具自动执行的,寻求最自动化的过程。如果任何自动化失败,该工具还包含一个内置的浏览器,允许操作员手动完成这些步骤。
请注意,Craigslist 在 2018 年的 法案期间终止了 “Personal” 部分,我们认为这一功能在程序中已过时,不再使用。
历史上,Love-GPT 也对其他约会网站/社交平台感兴趣。例如,我们能找到 Twoo、Oodle 和 Fetlife的痕迹。不过,这些平台的适当功能在该工具中已不再包含。
使用 ChatGPT
在 2023 年,作者开始使用 ChatGPT 生成新的个人资料描述以及与约会平台用户互动的其他提示。作者使用的 ChatGPT API令牌是硬编码在二进制文件中的。
我们估计 ChatGPT 功能是在 2023 年 3 月左右出现的(可能是 2023-03-30,主模块版本
326),并且还在开发中。某些功能看起来仍然像是概念验证,我们推测它们尚未完全功能化,其中一些已经显现出更强的效果。
该功能提供了对即将到来的趋势的有趣见解,显示出使用生成式 AI 和大型语言模型(LLM)创造高度可信文本的潜力。我们可以看到,滥用生成 AI平台的工具正在出现,这可能是其中一个最早的实例,展示了不良行为者如何滥用这一技术。
总体而言,该工具利用 ChatGPT 包含以下功能(既有完成的,也有在开发中):
- 创建虚假个人资料描述,用于约会平台
- 阅读约会平台的收件箱并回复消息
- 要求提供电话号码
- 撰写首次联系讯息
- 根据模板聊天
在当前实现中,该工具使用以下两个 ChatGPT 模型:
text-davinci-003
gpt-3.5-turbo
请求参数
该工具为执行的任务使用不同的参数集,通过其 API 影响 ChatGPT根据需要执行功能。例如,用于创建个人资料正文的参数,以确保文本多样且简短,如下所示:
"temperature": "1"
"max_tokens": "60"
"top_p": "1"
"frequency_penalty": "0.5"
"presence_penalty": "0"
注意,对于其他提示,通常使用 temperature = 0.5
,以降低随机性。
该工具使用 “prompt
” 值在 API 请求的主体中生成输出。在某些情况下,会提供整个上下文以引导 ChatGPT 生成更精确的结果:
为了展示,这是 ChatGPT 通常对类似提示的回复:
有关 ChatGPT API 中可用参数的详细说明,可以参考 。
赢得工具
Love-GPT 使用大量额外工具和组件来保持隐蔽性/匿名化其与约会网站及其用户的互动。它还包含其他组件以便运行,使用通讯工具和协议、Android模拟器和 OCR 绕过 CAPTCHA。
保持匿名
该工具需要使用看起来真实的虚假请求指纹,以便可靠地访问约会平台。否则,平台可能会检测到此类活动并暂停/禁止账户或用 CAPTCHA和其他反爬虫措施轰炸访问。
下面是所使用的匿名工具列表,并附上简短描述。
工具 | 简短说明
—|—
AdsPower
| 防指纹工具,使用虚拟浏览器配置文件
FraudFox
| 虚拟机和用于用户代理和设备欺骗的工具
Identory
| 防指纹浏览器平台,为任何网站创建唯一身份
Kameleo
| 防指纹浏览器平台,使用虚拟浏览器配置文件
Luminati
| 代理网络,可为数据收集和网页抓取提供匿名性
MountProxy
| 住宅代理提供者
Multilogin
| 防指纹工具,使用虚拟浏览器配置文件
ProxyRental
| 住宅代理和动态 IP 提供者
总之,拥有这些工具,Love-GPT 有效地隐藏了自己的行踪,没有人能够有效区分来自该工具的连接和其他普通用户访问平台的连接。
通信组件
Love-GPT 可以直接在约会平台上与用户进行通信。由于平台通常需要验证用户,使用唯一的电子邮件地址,甚至需要 PVA账户(电话验证账户),该工具拥有完整的电子邮件和电话号码管理系统。为了实现这一目标,它使用了以下服务和工具:
- 邮件服务 –
Gmail
、Yahoo
PowerTCP
Pinger
SMSpva
(smspva.com
)TextFree
TextNow
Tropo
Twilio
SMSpva
是一个获取临时电话号码的服务。连同 TextFree
、TextNow
、Twilio
和其他工具,该工具集提供方便的方式,让用户能够获取用于 PVA 注册的 SMS 验证码。
该工具还能够分析并发送从创建的 Gmail 或 Yahoo 账户的收件箱中邮件,并将邮件转发到不同的地址。
最后,Love-GPT 还使用 PowerTCP
,更具体地说是 DartWeb.dll
,以支持网络和通信相关的流量与网络之间的通信。
购买新域名
Love-GPT 还有一个系统用于购买新域名并进行已注册域名的续订,包括进行域名的支付。历史上,这是通过 Entropay
进行的。但自从
Entropay 的消费者产品在 2019 年停止服务后,我们推测 Love-GPT 的操作员已转向其他类似的基于消费者的服务,但这在代码中没有反映出来 –
虚拟信用卡信息存储在作者的本地数据库中,而不是在二进制中。
该功能的主要目的是通过注册域名设置域名转发。为此,该工具使用 API 检查所需域名的可用性,检查自动续订选项,以及设置转发:
https://api.name.com/v4/domains/
Android 模拟
由于某些平台是基于移动的,例如 DuyenSo 或 Facebook 约会应用,该工具使用 LDPlayer
来模拟在支持的约会平台上的适当行为。
该工具还使用共享文件夹在模拟器和本地文件系统之间交换文件,主要用于传输照片:
E:\LDplayer_shared_folder_for_fbdating\
OCR 和 CAPTCHA
Love-GPT 在绕过 CAPTCHA 上做了相当多的努力。它使用两种不同的光学字符识别(OCR)工具来捕捉文本:
OmniPage
DeCaptcher
Love-GPT 拥有一个专用面板,一个控制中心,用于协调 CAPTCHA 绕过的功能。
CAPTCHA 控制中心
未来工作
在我们的研究中,我们发现了多个用途相似的其他工具,其中一些可能来自与 Love-GPT背后相同的作者。这些工具从更广泛的抓取工具到高度专业化的工具,例如仅专注于 Tinder。这显然显示了该领域中自动化的趋势,并且 ChatGPT可以帮助简化互动,以从受害者那里收集更多数据,而这些数据他们可能不会轻易分享。
Hash 值
Hash | 编译日期
—|—
8071dc3dc1e7814f644f2745bbebab8c159763a3605b3615847772851b3960ce
| 2023-06-06
cf809afcad7a2054a8c39a84443579d0c9d81ddf0233164bf2a4214a39b6206c
| 2023-03-30
标签:、、、、
分享:XFacebook