TG 批量导出多个群组聊天记录后怎么进行数据对比?

ZoeZoe09月26日406

我从TG批量导出多个群聊的记录,但不会对比这些数据,有没有办法能找出相同的、不同的内容?比如某条消息在多少个群里出现过?

1 个回答

aDataWhisperer
aDataWhisperer回答于 09 月 26 日
最佳答案

首先,导出的是文本文件吧,比如JSON或者CSV格式。你可以用Excel打开这些文件,方便整理、比对。

然后,按“消息内容”这一列筛选重复值,Excel自带功能可以统计一条消息出现在多少个群中。如果想要更直观的结果,可以写个Python脚本,用pandas处理,几行代码的事。

此外,你也可以使用Notepad++之类的工具,加上插件如Compare,来对比不同文件之间的内容。

如果不会写代码,推荐使用在线工具,比如Text Compare之类的网站,把文本粘进去就能看出区别。但是注意隐私问题。

最后,建议将所有群的数据统一格式,处理起来更方便。

您的答案