Python��ݴ��PySparkʵս

��ߣ��

��磺�廪��ѧ��ʱ�䣺2021-03-01

�� �� ҳ�� 310

��񵥣��/��

�� ͼ ��:¥49.0(6.2��) �� ~~¥79.0~~ ��¼��ɿ��Ա��

��빺�ﳵ �ղ�

�˷�6Ԫ��39Ԫ��˷�

?�½��س��

��>

>
��ս�в�5000��(��)

��ս�в�5000��(��)

¥38.8¥88
>
��ܲ��.��ʵ��֮·

��ܲ��.��ʵ��֮·

¥49.3¥69
>
��һ�д��Android

��һ�д��Android

¥58.4¥99
>
��ѧϰ

��ѧϰ

¥92.4¥168
>
Unreal Engine 4��ͼ��ȫѧϰ�̳�

Unreal Engine 4��ͼ��ȫѧϰ�̳�

¥72.2¥168
>
��ϵͳ-ԭ��3��

��ϵͳ-ԭ��3��

¥104.3¥139
>
Word/Excel PPT 2013�칫Ӧ�ô��ŵ��ͨ-(��1DVD.��Ƶ��ѧ+�칫ģ��+PDF��)

Word/Excel PPT 2013�칫Ӧ�ô��ŵ��ͨ-(��1DVD.��Ƶ��ѧ+�칫ģ��+PDF��)

¥21¥49.9

��Ʒ��
��Ʒ��(0��)

��ͼ��:¥49.0 ��빺�ﳵ

��Ȩ��Ϣ
��ɫ
��ݼ��
Ŀ¼
��߼��

Python��ݴ��PySparkʵս ��Ȩ��Ϣ

ISBN��9787302575085
��룺9787302575085 ; 978-7-302-57508-5
װ֡��һ�㽺��ֽ
��
��
��ࣺ
��/��
>
��/��Ŀ��

Python��ݴ��PySparkʵս ��ɫ

PySpark��ԶԴ��ݽ��зֲ�ʽ��˴��ݵ�ѧϰ�ż��һ��PySpark��Ž̲ģ��ص㽲��PySpark��װ��PySpark�÷��ETL��ݴ��PySpark��ѧϰ��ʵս��*��һ��ۺ�ʵս��߼��ϵ��ʺ��һ��Python��Ĵ��ݷ��ʹ��Աѧϰʹ�á�

Python��ݴ��PySparkʵս ��ݼ��

�ҹ��»��Ҫ�ӿ��ġ��˹��ܵ��ͻ��ʩ�Ľ��ȣ��Ҫ��Ĵ��˲š�PySpark��ԶԴ��ݽ��зֲ�ʽ��ʹ��ѧϰ�ż��һ��PySpark��Ž̲ģ��ʺ��һ��Python��Ķ��ѧϰʹ�á� ��Ϊ7�£��½��ܴ��ݵĻ����õĴ��ݷ��ߣ��2�½��Spark��Ϊ��ݴ��ص��㷨��3�½��Sparkʵս��Ĵ��漰Windows��Linux��ϵͳ��4�½��Ӧ��PySpark��ݽ��в��5�½��PySpark ETL��漰PySpark��ȡ��ݡ��ݽ��ͳ�Ʒ��ݴ��ݣ��6�½��PySpark��MLlib��зֲ�ʽ��ѧϰ��Titanic�Ҵ��Ԥ�⣩��7�½��һ��PySpark��Kafka��ϵ�ʵʱ��Ŀ�� ȫ�桢ʾ��ḻ��Ϊ��PySpark��Ŷ��Ƽ��Ĳο��飬ͬʱ��Ϊ��רԺУʦ��Ľ�ѧ�ο��飬Ҳ��Ϊ�ߵ�ԺУ��רҵ�Ĵ��ݼ��̲�ʹ�á�

Python��ݴ��PySparkʵս Ŀ¼

Ŀ ¼ ��1�� ʱ�� 1 1.1 ʲô�Ǵ�� 1 1.1.1 ��ݵ��ص� 2 1.1.2 ��ݵķ�չ�� 3 1.2 ��µķ�� 4 1.2.1 Hadoop 5 1.2.2 Hive 6 1.2.3 HBase 6 1.2.4 Apache Phoenix 7 1.2.5 Apache Drill 7 1.2.6 Apache Hudi 7 1.2.7 Apache Kylin 8 1.2.8 Apache Presto 8 1.2.9 ClickHouse 8 1.2.10 Apache Spark 9 1.2.11 Apache Flink 10 1.2.12 Apache Storm 10 1.2.13 Apache Druid 10 1.2.14 Apache Kafka 11 1.2.15 TensorFlow 11 1.2.16 PyTorch 12 1.2.17 Apache Superset 12 1.2.18 Elasticsearch 12 1.2.19 Jupyter Notebook 13 1.2.20 Apache Zeppelin 13 1.3 С�� 14 ��2�� ݵ��ʿ��Spark 15 2.1 Hadoop��̬ϵͳ 15 2.1.1 Hadoop�� 15 2.1.2 HDFS��ϵ�ṹ 19 2.1.3 Hadoop��̬ϵͳ 20 2.2 Spark��Hadoop 23 2.2.1 Apache Spark�� 23 2.2.2 Spark��Hadoop�Ƚ� 24 2.3 Spark��ĸ�� 25 2.3.1 Spark��ջ 25 2.3.2 Spark��мܹ� 26 2.3.3 Spark��ģʽ 27 2.4 Spark�� 29 2.5 SQL in Spark 33 2.6 Spark��ѧϰ 33 2.6.1 ��㷨 35 2.6.2 ��Ҷ˹�㷨 36 2.6.3 ֧��㷨 36 2.6.4 ��ɭ��㷨 37 2.6.5 �˹��㷨 38 2.6.6 ��㷨 39 2.6.7 ��Իع��㷨 40 2.6.8 KNN�㷨 40 2.6.9 K-Means�㷨 41 2.7 С�� 42 ��3�� Sparkʵս��趨 43 3.1 ��Spark��ǰ�� 43 3.1.1 CentOS 7��װ 45 3.1.2 FinalShell��װ 55 3.1.3 PuTTY��װ 58 3.1.4 JDK��װ 60 3.1.5 Python��װ 63 3.1.6 Visual Studio Code��װ 64 3.1.7 PyCharm��װ 65 3.2 һ��ӽ��Spark�� 66 3.2.1 Linux�Spark�� 66 3.2.2 Windows�Spark�� 69 3.3 ��Hadoop��Ⱥ 79 3.3.1 CentOS�� 79 3.3.2 Hadoopα�ֲ�ģʽ��װ 81 3.3.3 Hadoop��ȫ�ֲ�ģʽ��װ 87 3.4 ��װ��Spark��Ⱥ 93 3.5 ��װ��Hive 99 3.5.1 Hive��װ 99 3.5.2 Hive��Spark�� 108 3.6 ��콻��ʽSpark�� 110 3.6.1 Spark Shell 111 3.6.2 PySpark 112 3.6.3 Jupyter Notebook��װ 112 3.7 С�� 118 ��4�� PySpark 119 4.1 Python �﷨��ϰ 119 4.1.1 Python��﷨ 120 4.1.2 Python�� 124 4.1.3 Python�� 135 4.1.4 Python�� 139 4.1.5 Python�� 143 4.1.6 Pythonģ��Ͱ� 149 4.1.7 Python�� 154 4.1.8 Python�쳣�� 157 4.1.9 Python JSON�� 159 4.1.10 Python��ڴ�� 160 4.2 ��PySpark��**��Spark RDD 161 4.2.1 PySpark Shell ��RDD 163 4.2.2 VSCode��̽��RDD 165 4.2.3 Jupyter ��̽��RDD 167 4.3 RDD�Ĳ��۲� 168 4.3.1 first�� 169 4.3.2 max�� 169 4.3.3 sum�� 170 4.3.4 take�� 171 4.3.5 top�� 172 4.3.6 count�� 172 4.3.7 collect�� 173 4.3.8 collectAsMap�� 174 4.3.9 countByKey�� 175 4.3.10 countByValue�� 175 4.3.11 glom�� 176 4.3.12 coalesce�� 177 4.3.13 combineByKey�� 178 4.3.14 distinct�� 179 4.3.15 filter�� 180 4.3.16 flatMap�� 181 4.3.17 flatMapValues�� 181 4.3.18 fold�� 182 4.3.19 foldByKey�� 183 4.3.20 foreach�� 184 4.3.21 foreachPartition�� 185 4.3.22 map�� 186 4.3.23 mapPartitions�� 187 4.3.24 mapPartitionsWithIndex�� 187 4.3.25 mapValues�� 188 4.3.26 groupBy�� 189 4.3.27 groupByKey�� 190 4.3.28 keyBy�� 191 4.3.29 keys�� 192 4.3.30 zip�� 193 4.3.31 zipWithIndex�� 194 4.3.32 values�� 194 4.3.33 union�� 195 4.3.34 takeOrdered�� 196 4.3.35 takeSample�� 197 4.3.36 subtract�� 198 4.3.37 subtractByKey�� 198 4.3.38 stats�� 199 4.3.39 sortBy�� 200 4.3.40 sortByKey�� 201 4.3.41 sample�� 202 4.3.42 repartition�� 203 4.3.43 reduce�� 204 4.3.44 reduceByKey�� 205 4.3.45 randomSplit�� 206 4.3.46 lookup�� 207 4.3.47 join�� 208 4.3.48 intersection�� 209 4.3.49 fullOuterJoin�� 210 4.3.50 leftOuterJoin��rightOuterJoin�� 211 4.3.51 aggregate�� 212 4.3.52 aggregateByKey�� 215 4.3.53 cartesian�� 217 4.3.54 cache�� 218 4.3.55 saveAsTextFile�� 218 4.4 �� 220 4.4.1 �㲥�� 220 4.4.2 �ۼ�� 221 4.5 DataFrames��Spark SQL 223 4.5.1 DataFrame�� 223 4.5.2 Spark SQL��÷� 228 4.5.3 DataFrame�� 231 4.6 ׫д**��Spark�� 245 4.7 �ύ�� Spark �� 246 4.8 С�� 248 ��5�� PySpark ETL ʵս 249 5.1 ��ʶ��ϵ�Ԫ��ʽ 249 5.2 �۲�� 255 5.3 ѡ��ɸѡ��ۺ� 267 5.4 �洢�� 269 5.5 Spark�洢��ݵ�SQL Server 272 5.6 С�� 275 ��6�� PySpark�ֲ�ʽ��ѧϰ 276 6.1 ��ʶ��ݸ�ʽ 277 6.2 ��ͳ�� 280 6.3 �� 284 6.4 ��ʶPipeline 288 6.5 �߼��ع�ԭ��Ӧ�� 290 6.5.1 �߼��ع��ԭ�� 290 6.5.2 �߼��ع�Ӧ��ʾ��Titanic�Ҵ��Ԥ�� 291 6.6 ��ԭ��Ӧ�� 295 6.6.1 ��ԭ�� 295 6.6.2 ��Ӧ��ʾ��Titanic�Ҵ��Ԥ�� 296 6.7 С�� 299 ��7�� ʵս��PySpark+Kafkaʵʱ��Ŀ 301 7.1 Kafka��Flask�� 301 7.2 ��ʵ�� 303 7.3 С�� 310

չ��ȫ��