报告题目 | 电子商务环境下信息K均值聚类分析方法研究 | ||
报告人(单位) | 曹杰教授(南京财经大学) | ||
点评人(单位) | 张建军(电子商务系) | 点评人(单位) | 黄超(电子商务系) |
时间地点 | 2011年12月2日下午2:00九龙湖太阳集团tyc539B201会议室 | ||
报告内容摘要 | | ||
聚类(clustering)是将物理或抽象对象的集合分成相似的对象类的过程,聚类是数据挖掘中的一个重要议题,而且聚类在电子商务中有着广阔的应用背景,如针对互联网文档、Web服务、客户、图像、甚至视频中帧的聚类分析。论文介绍信息K均值(INFO-K-means)聚类分析方法的最新研究进展及其应用,信息K均值通常采用KL聚类作为准则函数,但是,当聚类对象是高维稀疏数据时,计算KL距离遇到困难。本文提出一种称为SAIL(Summation-bAsed Incremental Learning)的增量学习方法来解决上述问题,而且为了增强SAIL搜索解空间的速度和稳定性,将变邻域搜索(VNS)与SAIL结合,提出V-SAIL方法;然后,又将多线程技术使V-SAIL并行化搜索,称为PV-SAIL方法。目前,SAIL可以用到互联网文档聚类和人脸识别领域,较经典的CLUTO工具而言,SAIL具有更高的聚类性能与速度。 |