小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
内容简介这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:部分(~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各
本书旨在探讨云计算在科学数据分析中不断演化发展的角色和地位变化,该项工作的重要性在于所有的科学领域都是数据驱动的。内容包括:公共云平台上LIGO物理应用的可扩展部署:工作流引擎与资源配置技术;面向大数据的FutureGrid测试平台;支持数据密集型应用的云网络;IaaS云测试案例:方法,挑战与经验;面向数据密集型应用的GPU加速云计算;面向数据密集型科研应用的适应性负荷分割与部署方法;DRAW:一种新的面向数据密集型应用的具有位置偏好
工欲善其事,必先利其器。数据分析也不例外,本书基于Excel,通俗地讲解数据分析全流程工具。作为《谁说菜鸟不会数据分析(入门篇)》的姊妹篇,本书继续采用职场三人行的方式来构建内容,细致梳理了数据分析工作的完整流程,并基于常用的办公软件Excel,精心挑选能够提高工作效率的常用工具来讲解。这些工具涵盖数据处理(Microsoft Access)、数据分析(Power Pivot、Excel数据分析工具库)、数据呈现(水晶易表)和报告自动
如今,流式数据是大数据中的一个大问题。 随着越来越多的企业试图掌控遍布全球的无限海量数据集,流式系统终于到了足以被主流接纳的成熟度。通过这本实用指南,数据工程师、数据科学家和开发人员将学习到如何以概念化和无关于平台的方式处理流式数据。基于对Tyler Akidau的热门博文《Streaming 101》和《Streaming 102》的拓展,本书将带你从入门到细致入微地理解实时数据流处理的what、where、when和how。你还将
本书是MathWorks图书计划作品。本书凝聚了薛定宇教授30年的MATLAB科研与教学积淀、30年的MATLAB推广与普及经历!其授课视频在爱课程与中国慕课数拥有十万读者学习的视频课程!英文版全球同步发行!视频公开课: 爱课程或中国大学MOOC(慕课) 现代科学运算MATLAB语言与应用控制系统仿真与CAD(非严格配套本书视频,仅供读者参考)。配书源代码: 配书源代码可以到清华大学出版社网站本书页面下载。薛定宇大讲堂系列图书将陆续出
本书首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,又介绍了核心分析技术。内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现...
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析——从玩转Excel开始、海量数据管理——拿MySQL说事儿、数据可视化——Tableau的使用、数据分析进阶——Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学
内容简介这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。全书一共8章:-3章
零基础入门,让读者轻松、快速地掌握使用Power BI 创建和设计报表的整体流程。本书为读者提供了一个轻松愉快的阅读学习体验,全彩印刷、版式灵活、颜色清爽、内容优选、案例典型、视频赠送。本书包含大量案例,读者可以边学边练,书中的大多数3 级标题以案例名称命名,既便于读者从目录中快速找到相应的案例,又能让读者了解每个知识点、每项技术的实际应用场景,从而实现技术与应用的无缝对接。为了便于读者学习和练习,本书附赠所有案例的源文件和重点案例的
本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下
随着大数据的兴起,各种数据工具以及可视化软件层出不穷,但Power BI却凭借着令人赞叹的视觉对象以及能够在任何设备上与同事共享等优势在多个数据工具中脱颖而出。本书开门见山地介绍了数据分析之前所要了解的知识,如为什么选择Power BI、学习Powerbi可能会遇到的问题等;而后通过报表制作的全流程让读者体验到Power BI的魅力,让读者了解通过Power BI能够玩转数据的获取、整理、建模、可视化以及发布的全过程。随后对数据整理、
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本
《谈谈大数据的那点事》是一本关于大数据的妙趣横生的科普读物。全书分三部分:一部分介绍大数据时代、大数据的内涵、大数据认知的误区,以及大数据的安全性;第二部分介绍一些有趣的案例,大数据与我们生活的关联、大数据带来意想不到的结果、大数据研究与应用的新领域,以及引发的反思;第三部分介绍推动大数据发展的动力、大数据产业发展的一些思考、大数据人才培养与团队建设,以及人工智能与统计学的关系等。 为了让读者更全面、准确而轻松地了解大数据,本书
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的
《数据仓库(原书第4版)》详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库的复查要目。 《数据仓库(原书第4版)》是数据仓库的创始人撰写的关于数据仓库的著作,这个新版本收录
本书共分14章,内容主要有R语言简介、数据读取与写入的方法,条件判断、循环等流程控制以及自定义函数,高级绘图、低级绘图、交互式绘图的说明,决策树、支持向量机、人工神经网络的介绍,基本统计、机器学习、数据挖掘、文本挖掘、大数据分析的应用,层次聚类法、K平均聚类算法、模糊C平均聚类算法、聚类指标、基因算法及人工蜂群算法的应用。 本书适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读
本书内容详实而富有实际指导价值, 通过本书, 软件开发者和架构师将学到如何将这些原则用于实践, 如何在最新应用架构中充分发挥数据的威力。内容包括: 数据系统基础 ; 分布式数据系统 ; 派生数据...
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
随着计算机和互联网技术的飞速发展和广泛普及, 互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后, 需要通过数据预处理和数据分析来获取数据的价值, 从而造福人类, 推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南, 内容包括三部分: 基础知识、基于Python的大数据预处理、基于Python的大数据分析...
本书名《数典》,定义为大数据标准术语体系,是迄今为止优选首部全面系统研究大数据标准术语的多语种专业工具书。该书以优选语境和未来视角,对大数据知识体系进行了全面梳理,提出了九个方面的术语架构,并以十一种语言对照编纂,形成了统一规范、符合靠前通用规则的多语种学术话语体系和术语标准体系...
本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因
在大数据时代下,互联网平台产生的大规模海量搜索数据的价值不断得到学术界和工业界的重视。然而,现有的互联网海量搜索数据的研究中缺乏系统的分析和讨论,并没有建立一套针对其数据特征的分析框架。针对目前互联网海量搜索数据在预测和预警研究方面的不足,本书提出了一个基于互联网海量搜索数据的预测及预警分析框架,以互联网搜索数据为基础,通过网络文本挖掘、特征选择等确定关键词,将计量经济模型、人工智能技术等综合集成起来,提出了关键模型、方法和技术,并将
Python 是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI 技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python 来做预测,不仅能够在业务上快速落地,还让代码维护更
本书针对未来想要从事数据分析工作的在校学生、想要转行做数据分析的在职人员,以及想要在数据分析领域提高自己或跳槽的从业人员,深入浅出地讲解了面试和未来实际工作中所需的知识与技能,让读者对数据分析师这个岗位有更为全面和深刻的了解。全书主要分为面试前的准备、面试中的技巧、面试中所需的知识储备、编程技能、实战技能,以及进一步学习提高的方法几部分,内容涵盖数据分析师面试的全流程,多方面提高读者在未来面试中的竞争力...
本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序,很后介绍监控、配置、调试、测试和开发等不错主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈
近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。部分 大数据处理框架的基础知识(~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分 S
大数据思维变革、大数据概念、大数据与云计算和物联网及人工智能、大数据采集、大数据存储、大数据分析、大数据可视化、大数据安全、大数伦理、大数据应用。本书可作为大学生的大数据通识教材,也可作为IT人员、企业策划和管理人员、培训中心的参考书...
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分
“十三五”以来,中石油、中石化、万华化学、华谊化工、国家电网、宝武钢铁等靠前流程行业领头者开展了数字化、智能化建设,加快数字化油田、智能炼厂、智慧电网、智慧炼钢等建设。信息化与自动化互相交织融合,积累了大量的工业数据,给以油田开发、石油石化、化工、钢铁、电力为代表的流程工业带来了新的挑战与机遇,也为其创新带来了新的技术能力。本书以大数据治理、大数据分析为主线,以油气开发、石油石化、化工、钢铁、电力为代表的流程工业大数据创新为分支,详细
《数据治理:工业企业数字化转型之道》是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运
《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。 《数据挖掘与预测分析(第2版)》的新内容: 添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本.效益分析、缺失数据填补、聚类优劣度量以及细分模型等。 针
《金融大数据》阐述了大数据技术在国内外金融领域的发展和应用现状,从大数据视角加以思考和探索,为金融创新、金融大数据研究和应用提供有益支持。 全书共15章。第1、2章介绍金融大数据的应用现状、资源和技术等。第3至14章是该书重点,分别介绍了大数据技术在证券期货、银行、保险和互联网金融中的应用。第3至5章为证券期货应用,典型应用包括自动化交易策略设计、金融期货风险监管、证券期货舆情分析等。第6至8章为银行业应用,典型应用包括银行客户
手机是人们推荐的电子设备,手机上的各种应用程序可以帮助人们更好地生活和工作。其中,大部分应用程序都是通过网络传输各种数据,以实现各种功能。为了了解这些应用程序的工作状态,需要抓取传输的网络数据,然后通过分析数据,了解应用程序的工作模式,防范恶意程序,保护用户信息。本书共7章,主要内容包括抓包基础知识、手机直接抓包、模拟器抓包、外部抓包、基础数据分析、HTTP/HTTPS数据抓包和分析、数据快速分析。本书适合手机应用开发人员、渗透测试人
本书通过对多个实例的演示与讲解,详细介绍了Excel的新功能组件Power Query在数据查询与数据转换方面的主要功能。全书共分为8章,主要包括Power Query编辑器的基本功能,常见数据类型的查询与导入,对原始数据进行合并、拆分、计算、转换等数据整理操作,Power Query中M公式的编写方法等。 本书语言风趣,专注于具体的应用场景,而不拘泥于功能本身,图示清晰、可操作性强且便于查阅,能有效帮助读者提高Excel的使用水平
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本的问题, 包括什么是数据, 什么是大数据, 什么是数据挖掘, 以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用六章的篇幅, 介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘六种方法。第8章介绍一些实际的应用, 演示简单的数据挖掘方法如何产生巨大的价值...
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练
《IBM SPSS数据分析实战案例精粹(第2版)》以IBM SPSS Statistics 24为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解了整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的,真正聚集于对数据分析精髓的领悟。本书还一并提供案例数据的下载,读者可完整重现全部的分析内容。 《IBM SPSS数据分析实战
谁将是忠实的客户?谁将不是呢?哪些消息对哪些客户细分有效?如何大化客户的价值?如何将客户的价值大化?《数据挖掘技术(第3版):应用于市场营销、销售与客户关系管理》提供了强大的工具,可以从上述和其他重要商业问题所在的公司数据库中提取它们的答案。自该书第1版问世以来,数据挖掘已经日益成为现代商业不可缺少的工具。在这个新版本中,作者对每个章节都进行了大量的更新和修订,并且添加了几个新的章节。该书保留了早期版本的重点,指导市场分析师、业务
高价值、低密度是大数据的特征,挖掘高价值、低密度的数据对象是大数据的一项重要工作。特异群组是一类高价值、低密度的数据形态,是指在众多行为对象中,少数对象群体具有一定数量的相同(或相似)的行为模式,表现出相异于大多数对象而形成的异常的群组。特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要的应用价值。对特异群组挖掘的研究代表了数据挖掘从浅层到深层的发展趋势和必要性。 本书系统地阐述了特异群组挖掘任务,包括介
人类是数据的创造者和使用者,中国已成为优选数据总量优选数据类型很丰富的的国家之一,大数据也将代表和催生一种全新的文明形式,中国,正以靠前的速度,硬来这个崭新的时...
随着互联网的逐步深入,各行各业在线上线下均产生了大量的数据,如何让这些数据产生价值成为每一个企业亟待解决的问题。不仅如此,随着我国新基建的加快推进,大数据和人工智能的发展犹如腾云之势,而数据作为新基建中“流淌的血液”,已经成为新时代下的金矿和石油。在这一波澜壮阔的时代背景下,为数据运营搭建系统化的体系及建立数据运营方法论则是运营工作进入下一个阶段的必由之路。本书抢先发售全面地搭建数据运营体系,并借由笔者的亲历经验,融合跨国企业与本土企
本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。本书从逻辑上可以分为三部分:部分是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、
随着中台概念被广泛讨论,其中数据中台又被赋予担任企业智能化任务的重任。当前,不仅是大企业,很多企业都在开始打造或者引入中台,用来解决企业面临的系统重复建设与数据孤岛的问题,在这个过程中,中台产品经理需要做什么事,解决什么问题,又会遇到怎样的困难与挑战? 本书~2章讲解了中台起源与数据中台产品需要什么样的能力;第3~6章主要讲解中台中的数据中台的建设与规划、数据分析的方法与策略、数据体系建设方法与应用和企业数据的价值等;第7~9章主要讲
《SAS编程与数据挖掘商业案例》是作者多年来在企业实践工作中的经验总结,详细讲解了使用SAS进行商业数据挖掘的方法。其中包含了目前公开出版的诸多SAS教材没有的大量实战内容。 《SAS编程与数据挖掘商业案例》内容全面、新颖**、综合性强,适合企业人员使用,也可作为数学、统计学、金融、电子商务、医药等专业的本科生、硕士生学习SAS编程和数据挖掘的参考资料。 读者可在http://www.cmpbook.com下载书中的SAS程序
本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部分:部分包含~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含2~14章,共有3个综合案例,包括泰坦尼克号生存数据分析、心脏病预测分析和旅游评论倾向性分析...
本书是一本面向Lua程序员和脚本语言爱好者的语言自制指南和实战宝典。作者融合自己丰富的工程实践经验,详细阐述Lua语言的核心语法和实现原理,深入探讨Lua虚拟机、编译器和标准库,并给出了实际可以编译执行的代码。助你从零基础开始编程实现Lua语言,有效理解脚本语言工作原理。全书分为3个部分,共21章。靠前部分主要讨论LuaAPI和虚拟机实现,包括二进制chunk格式、Lua虚拟机指令集、元编程、错误处理等。第二部分主要讨论Lua语法和编
“大数据”近年成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。简祯富、许嘉裕编著的《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。全
《大数据技术及其背景下的数据挖掘研究》围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,系统地阐述了大数据的基础理论、大数据处理架构Hadoop以及大数据存储与管理研究;由浅入深地论述了数据挖掘的基础理论、大数据挖掘技术研究、数据挖掘的艺术,并结合实践,阐述了数据挖掘的应用。 《大数据技术及其背景下的数据挖掘研究》对于读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值...
本书一开始先通过使用Java对大数据进行基本的统计分析,然后再讨论如分类、回归、聚类、集成等其他数据分析主题。它还涵盖了如推荐引擎、大规模图形分析、实时分析、深度学习等高级主题。书中涵盖了各种案例研究,例如tweet数据集的情绪分析、针对MovieLens数据集的推荐、电子商务数据集的客户细分、真实航班数据集的图表分析。这本书是使用Java实现大数据分析的端到端指南。Java如今已经是主流大数据环境(包括Hadoop)的事实语言。本书
老王子
泰戈尔
汪曾祺
[日]熊田千佳慕著,张勇译
梁实秋
[英]蕾秋·乔伊斯 著,焦晓菊 译
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071