对收集的法律文档进行一系列分析,包括根据规范自动切分、案件相似度计算、案件聚类、法律条文推荐等(试验目前基于婚姻类案件,可扩展至其它领域)。
爬取北大法宝网http://www.pkulaw.cn/Case/
keras theano 验证码破解 字母+数字
新浪微博爬虫:登录、关键词微博查询、微博监控
爬取QQ用户信息(qq号、昵称、生日、地址等基本信息)并做简要analysis。
模拟登陆QQ空间,获取好友信息,并做分析(年龄分布、性别分布、地址分布等)具体参见说明文档及1049755192文件夹下的分析结果展示。