SequoiaDB/SequoiaDB
SequoiaDB是一款文档类NoSQL数据库
  分布式 nosql 大数据 bigdata sequoiadb 最后更新时间 2015-10-19 13:43:52
bj278595437/aboutyunHadoop
about云分析discuz论坛apache日志hadoop大数据项目
  Apache Hadoop 论坛 discuz 大数据 最后更新时间 2014-08-10 20:34:57
拭旧/DA
大数据分析与应用。
  Hadoop 大数据 大数据存储 大数据技术大会 最后更新时间 2014-12-14 09:36:56
xiaobaosu/utils4s
scala开发中经常使用的各种工具库,包括通用、大数据
  bigdata scala util 大数据 最后更新时间 2015-11-17 13:06:57
qq_32231387/MapReduce
暂无项目信息...
  Hadoop mapreduce 分布式计算 大数据 最后更新时间 2016-04-29 08:52:52
Kyle_Zhao/alibaba_bigdata
阿里巴巴大数据比赛
  大数据 最后更新时间 2014-03-31 15:55:01
卖柴火的小晨子/cloudthink
网站cloudthink.top
  python thinkphp 云计算 大数据 最后更新时间 2016-02-06 08:24:17
pww71/pwwHashMap
对于c++程序来说 map的使用无处不在。影响程序性能的瓶颈也往往是map的性能。尤其在大数据情况下,以及业务关联紧密而无法实现数据分发和并行处理的情况。map的性能就成了最关键的技术。 比如:ip表、mac表,电话号码表、身份证号码表的查询、病毒木马的特征码的云查杀等等。 stl库的map采用二分查找,性能最差。Google的哈希map性能和内存目前是最优的,但是有重复碰撞的机率。 现在我把自己的算法发布出来。里面有两种map,build之后是哈希map。大家可以测试对比发现,我的算法属于零碰撞的几率,但是性能比哈希算法还优。就是普通map的性能也和google相差无几。 程序使用我的map 最直接的效益就是 原来需要十个服务器解决的方案 现在只需要一个服务器 声明:该代码不能用于商业用途,如需商业应用可以联系我QQ 大概一年五万 限制其他行业应用50万一年 下载地址: https://sourceforge.net/projects/pwwhashmap/files/pwwHash.zip/download 我的算法是完美哈希算法,但是算法原理是独树一帜与众不同的 我要保密。大家可以看看一下文章 http://blog.csdn.net/chixinmuzi/article/details/1727195 很多人认为现在有hadoop处理大数据是主流,其实它就是硬盘map,就是从硬盘快速查询表 通过键查值 取代复杂的数据库SQL语句。 对于大数据查询 可能不需要复杂的查询就用这种方式更快。而数据库查询也是硬盘查询 但是速度慢了 而我的map查询是内存根据键查询值 对于写程序的人来说 内存是效率和性能最高的。因此我的map用途是最广泛的。 可以提供给云查询服务器做大数据快速检索查询服务。 只有大数据太大的情况 超过内存的存放量,这才选择硬盘检索和数据库。
  算法 二分查找 内存 硬盘 大数据 最后更新时间 2014-06-26 17:46:04
s732444206/caiji.la
网页数据在线采集平台,自动监控网页列表,自动分析网页结构,提取内容,机器学习自动改变提取网页内容算法, 与现有站长网站对接。
  大数据 机器学习 采集 最后更新时间 2015-01-26 09:11:55
猪肉炖酸菜/zgrowing
记录IT生涯所有学习实践项目
  Web 大数据 编程语言 最后更新时间 2016-11-01 22:29:49
codemosi/storm_spark_hadoop
此项目旨在整合大数据分析领域内的三个技术storm_spark_hadoop。
  Hadoop spark storm 大数据 数据挖掘 最后更新时间 2015-02-24 17:34:57
ThomasTsang/AutomatedSplitter
自动分割及合并大数据文件成多个小数据文件
  数据 合并 大数据 最后更新时间 2013-11-22 18:02:33
JueFan_C/BloomFilter
大规模数据过滤器(传说中的布隆过滤器)
  爬虫 大数据 最后更新时间 2014-02-24 14:55:23
欧阳嘉/FinancialBigData
金融大数据分析:依托大数据和机器学习技术的经济趋势研究、行为金融学研究平台
  大数据 数据挖掘 机器学习 量化 金融 最后更新时间 2017-05-10 17:48:49
WANGTAO_520/Bigdata_Testing
大数据测试,hadoop/zookeeper/hbase/storm/kafka/flume
  Big Data testing 大数据 测试 最后更新时间 2015-07-25 13:11:35