Skype聊天数据分析
众所周知,Skype是hhs指定聊天工具。它界面简洁,功能多样贼tm卡
今天早上某人突发奇想想把过去的聊天记录全下下来,然后惊讶的发现有入口...
下载地址
申请下载,大概2h审批
出现
界面即可
里面是一个tar压缩包
解压后会出现一个叫"messages.json"的json文件
50M....
npp和notepad都打开失败
dev c++大法好!
略微分析了一下json结构
发现信息储存在conversations[]->messageList中(感谢@XGN)
每个message结构大概是
id - unknown
displayName - sender
originalarrivaltime - send time
messagetype - always RichText
version - unknown
content - the message
conversationid - unknown
from - user id
properties - unknown
amsreferences - unknown
e.g.
{
"id":"1580549755037",
"displayName":"HDD 292",
"originalarrivaltime":"2020-02-01T09:35:55.012Z",
"messagetype":"RichText",
"version":1580549755037,
"content":"maybe 2.17 :) ",
"conversationid":"19:90b75cc51f644d9995a9d33f502ad3de@thread.skype",
"from":"8:live:3aac2dbd4f289213",
"properties":null,
"amsreferences":null
}
再度感谢@XGN
Python on!
for conv in js['conversations']:
for msg in conv['MessageList']:
usr=msg['displayName']
if not (usr in users):
users[usr]=[]
users[usr].append((msg['content'],pt(msg['originalarrivaltime'])))
统计每人的话语,去除不必要的信息
再使用pandas+matplotlib绘图
结果如下
我就是Python 画图dd
版权声明:
作者:carott
链接:https://blog.hellholestudios.top/archives/374
来源:Hell Hole Studios Blog
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
共有 0 条评论