小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
《数据挖掘技术及其应用(精)》(作者杨杰、姚莉秀)系统地讲述了数据挖掘的基本概念和基本原理,并列举了在相应领域具有参考价值的算法及其改进和应用,是作者多年来从事教学和科研实践的成果。全书共9章,主要内容有:数据挖掘的基本概念和原理,数据预处理,各种分类、聚类和关联规则提取算法,以及在生物信息学、材料学中的实际应用案例。 《数据挖掘技术及其应用(精)》可用作计算机专业本?高年级学生或研究生的教材或参考书,也可供从事计算机信息处理、
从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、高级MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;最后,为了提高读者的算法设计与编程实战能力,
本书是一本面向Lua程序员和脚本语言爱好者的语言自制指南和实战宝典。作者融合自己丰富的工程实践经验,详细阐述Lua语言的核心语法和实现原理,深入探讨Lua虚拟机、编译器和标准库,并给出了实际可以编译执行的代码。助你从零基础开始编程实现Lua语言,有效理解脚本语言工作原理。全书分为3个部分,共21章。靠前部分主要讨论LuaAPI和虚拟机实现,包括二进制chunk格式、Lua虚拟机指令集、元编程、错误处理等。第二部分主要讨论Lua语法和编
这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你完全没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。
本书介绍了大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。本书共16章。第1章为绪论,就大数据、大数据分析等概念进行了阐释,并对本书内容进行了概述;第2~7章介绍了关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8章介绍大数据分析的数据预处理问题;第9章介绍降维方法;第10章介绍了数据仓库的概念、内涵、组成、体系结构和建立方法,还介绍了分布式数据仓库系统和内存数据
图文详解Kafka的内部原理、设计与实现 全面分析以Kafka为中心的分布式流平台 Kafka新特性详解,包括连接器、流处理...
只要学会数据思维,数据分析任你摆布 只要有想法肯动脑,有无基础皆可学会 只要懂得指标设计,项目落地信手捏来...
随着移动互联网和物联网时代的来临,人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据,例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像,等等。据此,以Google 为首的互联网公司提出了大数据(Big Data)的概念,并声称人类已经脱离了信息时代(Information Time,IT),进入了大数据时代(Data Time,DT)。显然,海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业
《数据挖掘在Web资源开发与利用中的应用研究》为国家社科基金后期资助项目成果,针对Web资源开发利用面临的主要问题,围绕数据挖掘优化方法,对用户行为分析、个性化推荐、Web信息检索以及Web页面链接分析等方面的内容展开研究。该成果定性与定量研究、理论与实证研究相结合,融合多个学科的技术成果,在研究方法和手段上有所创新。该成果既有翔实的理论阐述,又有系列的公式演示,严谨可信,具有较高的理论研究价值;同时该成果提出的一些新型模型和理论框架
本书从大数据发展现状出发, 在人类DIKW知识层次中认识“数据”, 阐述大数据时代以数据为中心的必然性, 进而提出数据管理的新范式, 即以系统科学及开放复杂巨系统为主要特征的范式, 并论述数据管理正在向新范式转换 ; 为解决数据系统中众多管理问题, 从数据语义出发给出数据分布模型概念, 并论述其是大数据时代数据管理的核心与基础 ; 定义了一种数据分布模型 —— MHM...
当数据存储在多个数据库中,如何查询数据?特别是当这些数据库是由不同的人分别设计。这是第一个全面介绍数据集成的书,由业界三个最受人尊敬的专家撰写。这本书讲解数据集成技术的理论知识,使用大量实例来解释基本概念。数据集成是解决跨多个数据源(如数据库,网页)的问题。目前在多种环境中都涉及数据集成问题,包括企业信息集成,在网络上的查询处理,政府机构之间的协调和科学家之间的合作。在某些情况下,数据集成是某个领域取得进展的关键。本书提供了数据集成的
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。很后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品...
内容简介这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:部分(~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各
《生态学数据分析:方法、程序与软件》的特点是操作性强,为生态学、植物学、动物学专业的研究生和科技工作者提供了实用的工具书...
《基于数据挖掘的国际科技合作资源监测方法、技术及应用》可供相关专业师生阅读,也可供科技管理人员使用...
本书共16章,分三个部分:基础篇、实战篇、提高篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。高级篇介绍了基于R语言二次开发的数据挖掘应用软件,使读者体验到数据挖掘二次的开发的魅力...
本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助TipDM-HB大数据挖掘建模平台,通过上机实验,以快速理解相关知识与理论...
《大数据挖掘》一书立足前沿性、注重实用性,着眼于大数据发展的最新研究热点和动向,系统介绍了大数据挖掘的概念、原理、技术和应用,全面而细致地定义和归纳了关联分析、聚类分析、分类分析、异常分析、特异群组挖掘和演变分析等大数据挖掘任务。 本书由上海市数据科学重点实验室朱扬勇教授团队主持著述,该实验室是国内首个致力于数据科学理论、方法和技术研究的机构,专注于金融、智能交通、医疗健康、智慧城市等多领域的大数据分析应用...
matlab官方(mathworks)资深大数据挖掘专家撰写,mathworks官方及多位专家鼎力推荐从技术、方法、案例、最佳实践4个维度循序渐进地讲解了大数据挖掘技...
本书第一章讲了云计算及计算机存储系统的相关概念,发展历史等方面知识。旨在以综述的方式使读者了解云存储方面背景知识。因为建立分布式存储系统首先需要考虑该系统的可靠性和可用性,所以第二章首先介绍了这两者的相关概念,之后结合实际讲了容错机制的分类及其层次分析。第三章针对第二章最后典型容错技术中的纠删码技术进行展开。首先介绍了存储编码的基础知识,在此基础上引出纠删码的概念等知识。随后,介绍了典型的三种编码--RS,BRS和CRS码的原理和编解
特征约简是数据挖掘的一项基础性技术,其目的在于降低数据的维度或提取数据中的重要特征或特征组合。本书系统地阐述了特征变换、特征选择的基本原理、基本过程,介绍了针对连续型、类属型等不同类型数据的过滤型、封装型及嵌入型特征约简方法。着重讨论了近年来兴起的软特征选择技术,以及嵌入自动特征约简的子空间聚类、子空间分类技术,并以实例的方式给出了不同方法在文档挖掘、信息安全以及生物信息学等领域的应用...
本书主要以项目实战为主线,教会读者如何开发全栈项目。本书基于Spring Boot3.1以上版本和Vue.js3.0版本的前后端分离项目开发,以及面向用户端的uni-app的小程序开发。本书的基础知识会在项目的开发过程中穿插讲解,不会单独讲解,采用实战驱动学习知识的教学方法,并通过详细的代码示例清晰的图解和源码解析帮助读者快速理解和掌握全栈项目开发的技巧和最佳项目实践。 本书分为3篇共22章。Spring Boot篇(第1~14章)从
继煤炭、钢铁和石油之后,数据正在成为重要的国家战略资源和国家间竞争的战略工具。数据主权是国家主权在网络空间的逻辑延伸和核心表现,关乎数据安全、个人隐私和数字经济发展,是国家安全和发展的核心利益所在。《数据主权与治理模式辨析》围绕数据主权及治理模式进行剖析,调研全球主要经济体的数据主权治理模式演化过程,在厘清数据主权内涵和概念、借鉴国外数据主权治理模式的基础上,以主权平等、合作共治为原则,从跨境数据流动、数据本地化存储、数字贸易、“长臂
本书介绍了超级计算机算力和AI算力的异同,从CPU流水线开始,描述主要的众核处理器架构和功能部件设计。在GPU和NPU等加速器部分,介绍了GPU为何能从单纯的图形任务处理器变成通用处理器。GPU在设计逻辑、存储体系、线程管理,以及面向AI的张量处理器方面成为最近几年全世界科技行业最瞩目的明星。本书对华为等厂商推出的NPU芯片设计也做了架构描述,中国也拥有独立自主知识产权的高算力芯片,并且支持多芯片、高带宽互连。本书也回顾了近20年来主
本书循序渐进、深入讲解了R语言数据统计分析与应用的核心知识,并通过具体实例的实现过程演练了知识点的用法和流程。全书共16章,分别讲解了R语言基础、R语言数据统计语法基础、数据获取和处理、绘制可视化统计图、描述性统计分析、探索性数据分析、推论统计、回归分析、方差分析、非参数统计分析、主成分分析、聚类分析、生存分析、因子分析、基于机器学习的患者再入院预测分析系统和中概科技指数统计分析与投资系统。全书简洁而不失其技术深度,内容丰富全面,历史
本书结合作者一线开发实践,循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章,第1章和第2章主要介绍Spark的基本概念、安装,并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理,帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL,这是处理结构化数据的基础工具。第6章展示了Spark Web UI,通过界面化的方式了解Spar
本书深入浅出介绍后摩尔时代的并行计算核心技术,理论与实践并重,同时兼顾数学模型、结构模型、编程模型。本书具有以下特色:从概念上明确算势与算力的联系与区别,强调在后摩尔时代背景下从潜在能力(算势)到实际能力(算力)的充分转化的重要性;注重量化分析和理论推导,单列一章对计算性能模型和存储性能进行了介绍;注重并行应用程序的设计,单列一章介绍并对比分析了共享存储编程与非共享存储编程的基本原理;注重融会贯通,培养整体观念,分别考察了共享存储结构
《Doris实时数据仓库理论与实战》系统地介绍了Doris的核心概念、架构原理和各项功能。全书共7章。第1章对Doris做了初步介绍。第2章重点介绍了Doris的数据表设计。第3章聚焦于Doris的数据导入。第4章介绍了Doris的数据导出和数据管理。第5章讨论了Doris中的数据更新和删除操作。第6章将读者带入Doris的进阶使用领域。第7章展示了Doris的生态扩展。通过《Doris实时数据仓库理论与实战》的学习,读者可以全面而深
在大数据时代下,互联网平台产生的大规模海量搜索数据的价值不断得到学术界和工业界的重视。然而,现有的互联网海量搜索数据的研究中缺乏系统的分析和讨论,并没有建立一套针对其数据特征的分析框架。针对目前互联网海量搜索数据在预测和预警研究方面的不足,本书提出了一个基于互联网海量搜索数据的预测及预警分析框架,以互联网搜索数据为基础,通过网络文本挖掘、特征选择等确定关键词,将计量经济模型、人工智能技术等综合集成起来,提出了关键模型、方法和技术,并将
本书讲述了在实际运营中核心的数据挖掘分析案例,为读者重点展示了SAS在精准营销、客户流失预警、客户分群、广告点击、信用卡欺诈、信用风险评分等领域中的具体应用。 本书分为16章,以数据挖掘基础知识介绍开始,循序渐进地讲述了Kaggle数据科学社区调查数据分析、考察汽车耗油量与里程数的关系分析、影响汽车销售的关键因子分析、健身运动中耗氧量回归分析、旅客量预测分析、客户群分类判别分析、销售公司的客户分群、员工离职预测、广告点击率预测、产品精
《金融大数据》阐述了大数据技术在国内外金融领域的发展和应用现状,从大数据视角加以思考和探索,为金融创新、金融大数据研究和应用提供有益支持。 全书共15章。第1、2章介绍金融大数据的应用现状、资源和技术等。第3至14章是该书重点,分别介绍了大数据技术在证券期货、银行、保险和互联网金融中的应用。第3至5章为证券期货应用,典型应用包括自动化交易策略设计、金融期货风险监管、证券期货舆情分析等。第6至8章为银行业应用,典型应用包括银行客户
《企业数据治理与SAP MDG实现》从讲解大数据与企业数据治理之间的重要关系出发,首先阐述数据治理在企业数字化转型过程中的定位与作用。然后通过讲述数据治理框架以及企业数据管理规划等方面的基础内容来阐述数据治理相关内容在企业中推进的顶层方向、推行范围与落地方式。通过概念解析、方案实例等方式讲述了主数据管理维度在数据管理中的定位、作用、目标以及某行业中此类项目建设的部分实际内容,如对数据管控方案和相关主数据平台产品(SAP MDG)进行了
本书使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的不错技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面
本书系统而全面地介绍了云存储安全相关的关键技术及其近期新研究成果。首先对云存储做一概述; 然后从云存储安全体系结构说起,按照云存储安全的需求层次,依次介绍云存储虚拟化安全、云存储系统身份认证与访问控制、加密云存储系统、密文云存储信息检索、云存储服务的数据完整性审计、云存储数据备份与恢复等内容; 很后介绍大数据时代的云存储安全。 云存储服务是大数据时代数据存储的基础,保障云存储安全是大数据分析与计算的基石。本书内容由浅入深,按照云存储
本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、
本书同其他数据分析方面的专著相比特点鲜明:首先,作者专注于问卷来源的数据分析,对数据分析方法的介绍更加专注、详细和深入;其次,作者没有讲解任何数据分析背后的数学原理,着重介绍的是数据分析方法的实际应用;*后,本书内容深入浅出,适合所有对问卷数据分析有需求的读者随时翻看查阅。...
《数据仓库(原书第4版)》详尽地讲述了数据仓库的基本概念、基本原理,以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装载问题、数据仓库与Web、ERP与数据仓库以及数据仓库的复查要目。 《数据仓库(原书第4版)》是数据仓库的创始人撰写的关于数据仓库的著作,这个新版本收录
网络科学是一门正在兴起的交叉性学科,与社会学、贸易物流、管理学等都密切相关。《网络科学与网络大数据结构挖掘》致力于系统地介绍网络科学的基本概念、思想和方法,使得具有高等数学基础的读者都能够看懂,并具备把网络科学方法用于实际网络分析的能力。 本书作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几
可靠性学术专著译丛系列图书: 《贝叶斯概率风险评估》 《贝叶斯可靠性》 《脆弱系统》 《复杂网络健壮性》 《复杂系统与过程可靠性及安全性》 《关键基础设施风险相互依赖性》 《系统重要性测度原理与应用》 《可靠性与风险分析蒙特卡罗方法》 《可靠性与风险分析算法》 《系统工程与分析(第5版)》 《系统可靠性研究新进展》 《系统软件可靠性》 《保修数据收集与分
本书使用一套金融数据以及Elasticsearch搜索技术和聚合框架,用来进行数据分析,是一本技术全面、案例丰富、注重实操的入门书。书中不仅细致地讲解Elasticsearch基础知识和核心接口,还进一步讲述数据建模和实际应用,例如金融舆情分析及机器学习等技术应用。最后逐步详细讲解了如何以编程方式构建RESTful服务接口,实践所学技术。由于书中有很多金融数据分析例子,读者也可了解相应应用场景以及学会其解决方案。书中示例采用一套开源
现代信息社会已经迈入大数据时代,但大数据给人们带来了的挑战,如何有效地从动态变化,结构化、半结构化和非结构化等多模态数据共存的大数据中进行高效实时的数据挖掘并发现有价值知识已成为当前信息科学领域亟待解决的问题。《大数据挖掘的原理与方法——基于粒计算与粗糙集的视角》针对大数据呈现的体量巨大、多源异构、动态性和不确定性等特点,以粒计算理论为基础,以典型粗糙集模型为对象,以增量学习技术为手段,以云计算并行框架为支撑平台,构建大数据分析与挖掘
近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。部分 大数据处理框架的基础知识(~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分 S
SPSS是一款经典流行的统计分析软件,完全适合作为各行业进行数据挖掘和数据分析的工具。全书内容共12章,书中第1~2章介绍SPSS的基本界面和窗口操作、调查研究、SPSS数据整理与数据挖掘的基本知识;第3~12章采用10个典型应用的综合案例分别介绍以SPSS 250版本在数据挖掘和数据分析中的具体应用。 本书内容由浅入深、循序渐进、结构安排合理,企业中的经营预测者与决策者、财会人员、市场营销人员、生产管理等部门的工作者、经济管理部门
全书理论联系实际,全面讲述数据挖据理论、技术及应用的教材。研讨了数据挖掘的方方面面,从基础理论到复杂数据类型及其应用。不仅讨论传统的数据挖掘问题,而且介绍了不错数据类型,例如文本、时间序列、离散序列、空间数据、图数据和社会网络。本书由基础篇和进阶篇组成。基础篇对应原书的~11章,进阶篇对应原书的2~20章...
随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。 《大数据分析与数据挖掘》主要介绍数据挖掘与大数据分析的理论方法与实践应用,并加入丰富的实务案例介绍,具体说明如何应用数据挖掘与大数据分析技术以解决真实问题,深入浅出地剖析从数据中掏金的秘诀。 《大数据分
围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了30多个**价值的案例分析,可以为各阶段的创业者提供行为准则。那些想要验证自己的创意、解决实际问题和渴望拥有成功事业的人,可以把本书当成一套明确的实践计划、一幅清晰的创业路线图、一本实践指南,或者一套反复实践的方法论...
在本书第1版的基础上,按照离线大数据和流式大数据两个场景进行划分在代码实现上以Python为主,紧贴主流编程语言代码的可用性增强...
《IBM SPSS数据分析实战案例精粹(第2版)》以IBM SPSS Statistics 24为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解了整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的,真正聚集于对数据分析精髓的领悟。本书还一并提供案例数据的下载,读者可完整重现全部的分析内容。 《IBM SPSS数据分析实战
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分
手机是人们推荐的电子设备,手机上的各种应用程序可以帮助人们更好地生活和工作。其中,大部分应用程序都是通过网络传输各种数据,以实现各种功能。为了了解这些应用程序的工作状态,需要抓取传输的网络数据,然后通过分析数据,了解应用程序的工作模式,防范恶意程序,保护用户信息。本书共7章,主要内容包括抓包基础知识、手机直接抓包、模拟器抓包、外部抓包、基础数据分析、HTTP/HTTPS数据抓包和分析、数据快速分析。本书适合手机应用开发人员、渗透测试人
泰戈尔
刘争争
老王子
梁实秋
[日]熊田千佳慕著,张勇译
汪曾祺
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071