Breakthrough

Breakthrough——web日志分析程序，寻找溯源过程中的突破口！

Go to file

综合执行读取模块：日志读取数据分离与各模块调用协调
性能提速模块：分割文件，启动多线程
文档生成模块：先记录IP-访问次数，然后将文件传给后续程序填写
初步分析模块：主要分析UA和响应码；捕获分离出来的【IP-UA-响应码】进行初步分析，将爬虫从数据中分离出来，标注归属公司；同时，判断是否为恶意扫描IP
次项分析模块：主要分析访问路径；结合上一步文件捕获分离出来的【IP-路径】进行第二步分析标记是否为合法爬虫（是否访问过robots.txt）；根据路径中关键词判断IP是否为攻击者，攻击类型含有哪些
终项分析模块：结合所有剩余部分进行综合分析（内容待定）