腾讯新闻汽车类别数据集

这个数据集是来自网站上收集的汽车类别的新闻数据,人工简单的处理了之后,打包成jsonl格式,来自 http://api.anacode.de/。

Download 收藏 点赞
未设置
未设置
Coming soon...
Coming soon...

数据集格式


该数据主要是 data.auto.qq.com 下的新闻类别数据,有详细的标注作者、内容、时间、url等信息。

{'author': '',
 'content': "\n心房颤动(房颤)的主要风险之一为栓塞,并且是缺血性卒中的独立危险因素之一,其导致卒中/短暂性脑缺血发作(TIA)的风险是无房颤患者的5倍。缺血性卒中的概念耳熟能详,但TIA却不然,TIA发作后接受规范化治疗的比例就更低了。合并房颤的TIA患者,如能及时干预和治疗TIA,能显著降低卒中复发风险。',\n  '早期对于TIA的概念局限于24小时内出现的神经功能障碍,但随着影像技术的发展,30~50%的TIA患者在MRI的DWI(弥散加权成像)显示出了新发脑梗死,因此逐步淡化了时间的概念,2009年美国心脏协会(AHA)将TIA定义为脑、脊髓或视网膜局灶性缺血所致的、未发生急性脑梗死的短暂性神经功能障碍\n",
 'date': '',
 'domain': 'data.auto.qq.com',
 'source': '',
 'title': '\r\n            上汽大众斯柯达--速派\r\n            局部细节\n',
 'url': 'http://data.auto.qq.com/car_serial/1080/index.shtml'}

代码读取


import json
file = "qq_auto.jsonl"
with open(file,'r') as fp:
line = fp.readline()    
result = json.loads(line)



Image Description