小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
作为《谁说菜鸟不会数据分析》家族的新成员,本书依然通俗地讲解数据分析的实践。《谁说菜鸟不会数据分析(SPSS篇)》继续采用职场三人行的方式来构建内容,细致梳理了准专业数据分析的常见问题,并且挑选出企业实践中容易碰到的案例,以轻松直白的方式来讲好数据分析的故事。从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且很好实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。尽可能避免使用晦涩难懂的统
如今,流式数据是大数据中的一个大问题。 随着越来越多的企业试图掌控遍布全球的无限海量数据集,流式系统终于到了足以被主流接纳的成熟度。通过这本实用指南,数据工程师、数据科学家和开发人员将学习到如何以概念化和无关于平台的方式处理流式数据。基于对Tyler Akidau的热门博文《Streaming 101》和《Streaming 102》的拓展,本书将带你从入门到细致入微地理解实时数据流处理的what、where、when和how。你还将
本书首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,又介绍了核心分析技术。内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现...
本书从实战出发,介绍微服务架构所带来的测试方面的挑战,以及如何利用新的技术来应对这些挑战。通过本书,读者可以学会如何编写微服务架构下的单元测试、组件测试、集成测试以及契约测试。在此过程中还会用到Arquillian、ShrinkWrap、Pact、Selenium、Docker、Hoverfly 等多个帮助测试的工具和框架。书中涵盖大量的代码和样例,可以帮助读者快速上手,并在自己的实际工作中应用这些技术。本书适合有一定Java 基础的
本书是一本从入门到精通模式的Selenium WebDriver实战经验分享书籍。全书共分为四个部分:部分为基础篇,主要讲解与自动化测试相关的基础理论、WebDriver环境安装、单元测试工具的使用方法及 WebDrvier的入门使用实例;第二部分为实战应用篇,基于丰富的实战案例讲解页面元素的定位方法及WebDriver的很常用API使用方法;第三部分为自动化测试框架搭建篇,深入讲解了页面对象的设计模式,以及分布式并发执行测试框架、数
Alluxio 这一以内存为中心的分布式虚拟文件系统,很初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Al
本书系统而全面地介绍了云存储安全相关的关键技术及其近期新研究成果。首先对云存储做一概述; 然后从云存储安全体系结构说起,按照云存储安全的需求层次,依次介绍云存储虚拟化安全、云存储系统身份认证与访问控制、加密云存储系统、密文云存储信息检索、云存储服务的数据完整性审计、云存储数据备份与恢复等内容; 很后介绍大数据时代的云存储安全。 云存储服务是大数据时代数据存储的基础,保障云存储安全是大数据分析与计算的基石。本书内容由浅入深,按照云存储
《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》源自网易公司多位资深数据库专家数年的经验总结和MySQL数据库的使用心得,在之前版本的基础之上,基于MySQL 5.7版本进行了内容升级,同时也对MySQL 8.0的重要功能进行了介绍。除了对原有内容的更新之外,本书还新增了作者在高可用架构、数据库自动化运维,以及数据库中间件方面的实践和积累。 《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》分为“基础篇”“开发篇
《谈谈大数据的那点事》是一本关于大数据的妙趣横生的科普读物。全书分三部分:一部分介绍大数据时代、大数据的内涵、大数据认知的误区,以及大数据的安全性;第二部分介绍一些有趣的案例,大数据与我们生活的关联、大数据带来意想不到的结果、大数据研究与应用的新领域,以及引发的反思;第三部分介绍推动大数据发展的动力、大数据产业发展的一些思考、大数据人才培养与团队建设,以及人工智能与统计学的关系等。 为了让读者更全面、准确而轻松地了解大数据,本书
本书从整体上进行了改编、扩展和提升。主题内容也有所延伸,其中包括数据的类型与域、表的比较、映像关系、聚集操作符与汇总、视图更新以及子查询。还特别收录了一个新附录——NoSQL与关系理论。本书涵盖以下内容:是否可以编写SQL查询找到在公司每个编程部门都至少工作过一次的员工?你是否可以确保查询的正确性?为什么恰当的列命名很好重要?数据库中的null会带来错误的答案。为什么?你又能做什么?映像关系如何能帮助你表述复杂的SQL查询?虽然SQL
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。简祯富、许嘉裕编著的《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。全
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
本书一开始先通过使用Java对大数据进行基本的统计分析,然后再讨论如分类、回归、聚类、集成等其他数据分析主题。它还涵盖了如推荐引擎、大规模图形分析、实时分析、深度学习等高级主题。书中涵盖了各种案例研究,例如tweet数据集的情绪分析、针对MovieLens数据集的推荐、电子商务数据集的客户细分、真实航班数据集的图表分析。这本书是使用Java实现大数据分析的端到端指南。Java如今已经是主流大数据环境(包括Hadoop)的事实语言。本书
随着计算机和互联网技术的飞速发展和广泛普及, 互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后, 需要通过数据预处理和数据分析来获取数据的价值, 从而造福人类, 推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南, 内容包括三部分: 基础知识、基于Python的大数据预处理、基于Python的大数据分析...
内容简介这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:部分(~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各
本书使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的不错技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面
本书提供了大数据和分析技术应用于石油和天然气行业的完整视图。这本书包含多个实例研究, 强调了在石油和天然气勘探和生产阶段对优化的迫切需求, 并展示了数据分析如何提供这种优化, 涉及石油和天然气的勘探、开发、生产和油气资产的复兴, 可有效地推动石油和天然气的勘探和生产...
本书分为三篇。第壹篇:从整体上给出数据大图和数据平台大图,主要介绍数据的主要流程、各个流程的关键技术、数据的主要从业者及他们的职责等;数据平台大图分离线和实时分别给出数据平台架构、关键数据概念和技术等;第二篇:介绍离线数据开发的主要技术,包含Hadoop、Hive、维度建模等,另外此部分还将综合上述各种离线技术给出离线数据处理实战;第三篇:集中介绍实时数据处理的各项技术,包含Storm、SparkSteaming、Flink、Beam
图文详解Kafka的内部原理、设计与实现 全面分析以Kafka为中心的分布式流平台 Kafka新特性详解,包括连接器、流处理...
随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了大数据(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),进入了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业
何欢、何倩主编的《数据备份与恢复(全国高等职业教育规划教材)》是国家级精品课程“数据备份与恢复”的配套教材,以数据恢复工程师的岗位需求为依托,以实际工作任务为导向,从硬盘结构与文件系统,数据备份,Windows操作系统备份与恢复,Windows文档修复,硬盘数据软件恢复,数据库备份与恢复,硬盘故障修复,U盘数据恢复,磁盘阵列数据修复等方面深入浅出地介绍了数据备份与恢复的基本知识和操作技能,着重强调数据恢复的技能训练。本书既可作为高职高
本书针对网络大数据具有时效性强、分布范围广的特点, 提出一个基于网络大数据的社会经济监测预警的研究框架, 对网络大数据进行深入分析和挖掘, 在此基础上就社会转型中的社会经济关键指标进行实时监测和智能预测, 为政府和相关管理部门提供有效的分析工具与决策支持...
《大数据时代的统计学思维:让你从众多数据中找到真相》是一本大数据时代下统计学思维和大数据分析的科普书籍,是一本了解大数据时代统计学思维和数据分析基本原理和方法的入门图书,是大数据时代每个人都需要了解的统计学基础理论、数据分析基本原理的入门图书。 《大数据时代的统计学思维:让你从众多数据中找到真相》结合30多个现实生活中的实例,介绍大数据时代下10多种常用的分析方法和基本原理,让你学会在众多数据中找到真相,而不被大量数据所欺骗,理论联系
只要学会数据思维,数据分析任你摆布 只要有想法肯动脑,有无基础皆可学会 只要懂得指标设计,项目落地信手捏来...
《企业级大数据平台构建:架构与实现》是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域工作超过20000小时的经验总结。作者朱凯从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,大家一定能找到灵感和思路来应对实际工作中面对的问题。本书在逻辑上分为三大部分:背景篇(靠前~2章):简单阐述了企业级大数据平台的重要性,并指出了作为一个企业
本书介绍了应用智能运维系统建设涉及的技术、工具、流程、方法, 系统地总结了应用智能运维系统的演进过程, 对比了市场主流的应用运维产品, 分析了关键智能化应用运维技术、相关开源软件工具的能力和真实行业用户建设案例。另外, 本书通过提炼、总结大量不同行业用户建设应用智能运维系统的典型应用场景, 全面透彻地介绍了相关项目的规划、开发、实施过程, 对企业应对未来数字信息时代应用运维场景下智能运维系统的建设和改造有较高的参考价值...
本书集结了作者近年来在大数据及其应用领域的研究成果, 针对大数据高效处理问题, 从点排序识别聚类、多标签排序、不平衡数据采样、主动学习、增量学习等方面研究并设计了相关算法。在此基础上, 对大数据环境下电信客户价值评价、客户换机预测和客户流失预测等问题, 设计了相关算法、流程和仿真实验, 并提出了一些合理化的建议, 为大数据分析与在相关行业的应用提供了参考...
本书基于国内外数据中心建设标准,总结归纳了数据中心规划与设计的理论、方法和实践经验,注重理论与实践相结合,为中国数据中心建设提供全新的理论架构、设计逻辑和方法、评估模型与实践经验。 本书主要内容包括数据中心概述、绿色数据中心的评价指标、网络及物理模型、可靠性/可用性模型、能效和经济模型、基础设施规划、技术要求、选址指南、装饰装修、供配电系统、防雷和接地系统设计、制冷、综合布线系统的建设、消防系统的建设、监控与管理、数据中心的评估。 本
这是一个大数据爆发的时代。面对信息的激流,多元化数据的涌现,大数据已经为个人生活、企业经营,甚至国家与社会的发展都带来了机遇和挑战,成为IT信息产业中具潜力的蓝海。 大数据可视化这种新的视觉表达形式是应信息社会蓬勃发展而出现的——因为我们不仅要呈现世界,更重要的是要通过呈现来处理更庞大的数据,理解各种各样的数据集合,表现多维数据之间的关联。换句话说,就是归纳数据内在的模式、关联和结构。复杂数据可视化既涉及科学也涉及设计,它的艺术
《Python数据分析与挖掘实战》涵盖数据分析与数据挖掘的基础知识、必备工具和有效实践方法,能让读者充分掌握数据分析与数据挖掘的基本技能。 《Python数据分析与挖掘实战》共分为15章,主要内容包括大数据获取、数据预处理、探索性数据分析、用Sklearn估计器分类、主流数据分析库、大数据的数据库类型、数据仓库/商业智能、数据聚合与分组运算、数据挖掘工具、挖掘建模、模型评估、社会媒体挖掘、图挖掘分类、基于深度学习的验证码识别、
本书针对MongoDB3做了精细更新,呈现MongoDB的所有新特性,涵盖2.2版引入的聚集框架、2.4版引入的哈希索引以及3.2版本的WiredTiger,还新纳入Node.js和Python。 MongoDB是非常流行的“大数据”NoSQL数据库技术,目前仍在蓬勃发展。来自10gen的DavidHows以及经验丰富的PeterMembrey和EelcoPlugge等MongoDB专家联袂撰写本书,在书中分享他们的宝贵专业知识
《数据挖掘导论(完整版)》介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所需的知识。《数据挖掘导论(完整版)》涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的主题。此外,书中还提供了大量示例、图表和习题。 《数据挖掘导论(完整版)》适合作为相关专
《大数据安全:技术与管理》是一本面向各层次大数据安全从业人员、研究人员和相关专业大学生的学习指南。作者融合自己丰富的工程实践经验,详细阐述了大数据从创建到传输、存储、处理、交换、恢复,直至数据销毁等各个环节所涉及的安全技术与管理方法。在网络安全和大数据安全日益受到国家和企业重视之际,《大数据安全:技术与管理》将成为你必备的参考书目。 《大数据安全:技术与管理》分四部分。首部分介绍了大数据的相关概念、面临的安全威胁及发展趋势;第二
本书围绕经典的统计方法与 R 语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计方法的推导与解读等都给出了细致的讲解。此外,为了将理论与实践紧密结合,本书每一章均提供了不同业务场景下的R语言编程实例,帮助读者练习巩固。本书适合相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者...
《Text data mining》 offers thorough and detailed introduction to the fundamental theories and methods of text data mining, ranging from pre-processing (for both Chinese and English texts), text representation, feature se
《面向高端制造领域的大数据管理系统》是“十三五”国家重点研发计划“云计算和大数据”专项“面向高端制造领域的大数据管理系统”项目的研究成果。全书共25章,分为导论篇、多模态异构数据源管理引擎篇、语义融合与一体化管理引擎篇、运维工具篇、测试篇和应用篇,紧密围绕我国先进制造发展的需求和国际大数据管理技术的前沿,在工业大数据一体化管理体系架构、多模态异构数据管理、语义融合与协同优化、运维工具与测试床等多个方面论述了本项目的重要成果。 《
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。 《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。 《大数据分
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。 由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。 《数据仓库与数据挖掘教程(第2版)》系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、K-均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖
围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了30多个**价值的案例分析,可以为各阶段的创业者提供行为准则。那些想要验证自己的创意、解决实际问题和渴望拥有成功事业的人,可以把本书当成一套明确的实践计划、一幅清晰的创业路线图、一本实践指南,或者一套反复实践的方法论...
本书共 14 章,内容涵盖:统计学的基本概念、推断性统计的相关理论和实例、方差分析、相关分析与回归分析、Logistic 回归、主成分分析与因子分析、聚类分析、判别分析、时间序列分析、SAS 编程基础、宏的概念和应用原理及上机练习指导。本书内容全面,汇集了统计学、多元统计学和 SAS 编程技术的核心内容。本书针对不同的实战案例进行分析和总结,并展示了程序运行的结果,使之具有较强的可操作性,便于读者理解和研习。本书可作为各行业数据分析师
生物医药大数据蕴含了很好丰富的信息和知识,是关乎人类生存与健康的重要战略资源,但只有对生物医药大数据进行高效处理和智能分析,才能真正推动生物医药研究和产业化从原来的假设驱动向数据驱动转变,因而近些年来生物医药大数据与智能分析逐渐成为潜力巨大且发展迅猛的交叉领域。本书简要介绍了并行计算、机器学习和深度学习应用于生物医药大数据的相关基础知识,并总结了作者团队在生物医药大数据处理和分析领域的若干成果,主要涵盖基因表达谱分析、微生物基因组、药
大数据正在开辟一个人类的新纪元。它已经渗透到当今社会活动的各个方面,它的应用开发已经成为国家的重要战略。大数据的理论、方法涉及到很多领域,包括数理统计、计算科学、应用数学等等,而且很多都尚处在不断完善、发展之中。本书试图较全面地介绍大数据技术的基本方法,包括以统计模型为主的各类数据模型以及他们的计算方法以及它们在各个不同领域,如人工智能,中的应用。这些不仅是大数据专业的学生和科技工作者必须具备的基本知识,也对攻读与数据有关的各类专业的
本书采用案例和理论相结合的形式,以Anaconda和PyCharm为开发工具,系统地重点阐述了利用Python进行数据预处理、分析与可视化等相关知识,讲解了Python各种数据处理展示的函数方法的使用方法。全书共有6章,分别是数据分析概述、Python基础、利用Pandas进行数据预处理、利用Pandas进行数据分析、利用Matplotlib进行数据可视化、Python数据分析与综合应用。在教学设计中安排了知识图谱、学习目标、知识指南
建立起SAS语法的基本框架和知识体系的逻辑框架,更将数据分析行业工作流程、技巧和行业发展融入书中,凝练出自我提升途径。...
经过十余年信息化建设,很多企业都上线了各种业务系统,积累了大量业务数据,具备应用 BI (商业智能)进行数据分析和数据化管理的条件。而如何让BI项目在企业中落地并持续运转,成为很多企业尤其是传统企业头疼的问题。本书聚焦 BI(商业智能)与 BI 项目, 重点介绍 BI 项目的建设流程和运营技巧,并围绕 BI 项目中的场景和人员两大要素,分享了 BI 在零售、金融、 制造、 医疗和教育等行业中的应用案例, 提出了搭建企业数据人才培养体系
本书通过实践操作介绍大数据爬取、清洗与可视化的具体实施方案,共10章,包括大数据爬取、清洗与可视化概述,爬虫概述,Requests库,BeautifulSoup爬虫,自动化测试工具Selenium,中型爬虫框架Scrapy,数据存储,数据清洗,Matplotlib可视化,Pyecharts可视化。书中的案例均经过实践验证,可以帮助读者深入理解数据信息在大数据行业中的重要应用。为方便复习和自学,各章均配备丰富的习题。本书可作为高等院校大
本书采用定性与定量研究、理论与实证研究相结合的研究方式, 融合多个学科的技术成果, 在研究方法和手段上有所创新。本书既包括翔实的理论阐述, 又有系列的公式演示, 严谨可信, 具有一定的理论研究价值 ; 并且提出的一些新型模型和理论框架具有较高的应用价值...
本书以R语言简介、数据挖掘基础为开篇,旨在让读者对所用工具及数据挖掘方法有所了解。随后的章节借助实际案例(数据挖掘网站用户行为分析及网页智能推荐、生活服务点评网站客户分群、水冷中央空调系统的优化控制策略、电商评价文本的主题特征词分析、均线投资策略等),从数据预处理、模型选择、算法介绍、R语言实现、结论分析及评价等方面进行详尽的论述,希望读者既可以了解数据分析与挖掘的一般流程及方法,又能对常用的算法及模型有所了解。每个案例分析都是一篇完
本书使用一套金融数据以及Elasticsearch搜索技术和聚合框架,用来进行数据分析,是一本技术全面、案例丰富、注重实操的入门书。书中不仅细致地讲解Elasticsearch基础知识和核心接口,还进一步讲述数据建模和实际应用,例如金融舆情分析及机器学习等技术应用。最后逐步详细讲解了如何以编程方式构建RESTful服务接口,实践所学技术。由于书中有很多金融数据分析例子,读者也可了解相应应用场景以及学会其解决方案。书中示例采用一套开源
工欲善其事,必先利其器。数据分析也不例外,本书基于Excel,通俗地讲解数据分析全流程工具。作为《谁说菜鸟不会数据分析(入门篇)》的姊妹篇,本书继续采用职场三人行的方式来构建内容,细致梳理了数据分析工作的完整流程,并基于常用的办公软件Excel,精心挑选能够提高工作效率的常用工具来讲解。这些工具涵盖数据处理(Microsoft Access)、数据分析(Power Pivot、Excel数据分析工具库)、数据呈现(水晶易表)和报告自动
社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?《挖掘社交网络(影印版 第3版 英文版)》第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界
老王子
[英]蕾秋·乔伊斯 著,焦晓菊 译
刘争争
汪曾祺
林奕含
梁实秋
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071