RT Journal T1 基于DOM树及行文本统计去噪的网页文本抽取技术 A1 李霞,蒋盛益 PB 《山东大学学报(理学版)》 FD 2012-03-20 YR 2012 JF 《山东大学学报(理学版)》 JO 《山东大学学报(理学版)》 VO 47 IS 3 SP 38 DO K1
网页文本抽取;DOM树;行文本统计;标点符号统计