大数据的主流技术、平台及方法论培训讲师:卜晓军(行业专家)1、什么是大数据 大数据与传统数据2、大数据的应用(1)技术与工具Teradata----行业领导者;Hadoop;流计算;LDW(Logical Data Warehouse);企业级数据仓库;大数据的管理及运维;(2)Teradata大数据探索平台ASTER3、大数据项目如...【阅读全文】
文章来源:http://www.pythonclub.org/python-files/mime-type摘要 MIME是目前互联网邮件普遍采用的格式标准,本文通过对MIME邮件格式规范的分析和说明,给出了从邮件中提取其所含各种信息的基本方法。关键词 MIME、邮件、格式、信息提取MIME,英文全称为“Multipurpose Internet Mail Extensions”,...【阅读全文】
文章来源:http://www.cnblogs.com/gpcuster/archive/2010/03/12/1684072.htmlCassandra是一个开源的分布式数据库,结合了Dynamo的Key/Value与Bigtable的面向列的特点。Cassandra的特点如下:1.灵活的schema:不需要象数据库一样预先设计schema,增加或者删除字段非常方便(on the fly)。2.支持range...【阅读全文】
1. Consumer behaviour is the study of when,why,how and where people do or don't buy a product。用户行为一般指用户通过中间资源,购买、使用和评价某种产品的记录。同时辅以用户、资源、产品自身及环境的信息。用户行为记录一般可以表示一组属性的集合:{属性1,属性2,...,属性N}2. 用户行为分析主要是研究...【阅读全文】