需求: 某个单位有海量的PDF文件,但不幸的是,所有文件的命名、分类都不规范,甚至很多文件名称都只是混乱的字符串 现在要实现一个系统,要求能够根据关键字查找PDF文件,并在查找出的列表中提供一定的内容预览信息(类似百度文库的搜索)