PhpDig

项目介绍:

PhpDig是一个采用PHP开发的Web爬虫和搜索引擎授权协议为GPL。通过对动态和静态页面进行索引建立一个词汇表。当搜索查询时,它将按一定的排序规则显示包含关键字的搜索结果页面。PhpDig包含一个模板系统并能够索引PDF,Word,Excel,和PowerPoint文档。区别于传统搜索引擎,PHPdig更适用于专业化更 强、层次更深的个性化搜索引擎,利用它打造针对某一领域的垂直搜索引擎是最好的选择。

链接:

暂无版本信息

讨论

同类项目

elasticsearch
ElasticSearch是一个基于Lucene构建的开源、分布式RESTful搜索引擎。设计用于云计算中,能够达到实时搜索、稳定、可靠、快速、安装和使用方便等效果。支持通过HTTP使用JSON进行数据索引技术。最早版本[v0.17.7](https://github.com/elasticsearch/elasticsearch/releases/tag/v0.17.7)发布于2011.9.19。
Carrot2
Carrot2是一个由Java和Perl语言开发的跨平台的开源搜索结果分类引擎。Carrot2提供的一个架构能够从各种搜索引擎获取搜索结果。它能够自动把搜索结果组织成一些专题分类。
Solr
Solr是一个基于[Lucene](https://code.csdn.net/OpenSource_SuperStar/lucene)的独立的企业级搜索应用服务器,用户可通过Solr提供的XML/HTTP与JSON接口在应用中集成企业级搜索服务。 Solr由CNET于2004年开发,最初主要为CNET提供站内搜索服务。2006年1月,CNET将其捐献给Apache,于2007年6月7日发布了1.2版本(从Apache孵化器毕业后的首个版本),并成为Lucene 的子项目。 Solr对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对查询性能进行了优化,并且提供了一个完善的功能管理界面。 **开发语言:**Java
Lucene
Lucene是一个高性能的全文检索引擎库,提供了一个简单却强大的API,使得开发者可以在应用程序中轻松实现全文检索功能,或者以此为基础建立完整的全文检索引擎。 Lucene最初是由Doug Cutting开发的,在2000年3月发布了第一个开源版本0.01,并于2000年10月发布了1.0正式版,2001年9月Lucene加入Apache软件基金会,成为Jakarta项目的一个子项目。 与同类产品相比,Lucene的优势包括:独立于应用平台的索引文件格式、分块索引、优秀的面向对象系统架构、独立于语言和文件格式的文本分析接口、强大的查询引擎等。 **开发语言:**Java
CLucene
CLucene是Lucene的一个C++端口,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。

相关讨论组

该项目还没有关联的讨论组