-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathatom.xml
478 lines (251 loc) · 20 KB
/
atom.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title>山雨欲来兮丶</title>
<icon>http://www.seanxia.cn/icon.png</icon>
<link href="http://www.seanxia.cn/atom.xml" rel="self"/>
<link href="http://www.seanxia.cn/"/>
<updated>2024-08-21T05:08:31.421Z</updated>
<id>http://www.seanxia.cn/</id>
<author>
<name>SeanXia</name>
</author>
<generator uri="https://hexo.io/">Hexo</generator>
<entry>
<title>SQLServer中文乱码及查询异常</title>
<link href="http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/49955695.html"/>
<id>http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/49955695.html</id>
<published>2024-08-21T05:08:06.550Z</published>
<updated>2024-08-21T05:08:31.421Z</updated>
<summary type="html"><p>记录一次工作中SQLServer查询异常的经历。</p>
<p>由于直连供应商那边要求使用sqlserver接收数据,故我们又在207安装了SQLServer数据库,我这边正常建表,然后导入数据,刚开始客户类型,厂家等字段使用常用字符串类型varchar,但是导入发现除数字</summary>
<category term="日常问题" scheme="http://www.seanxia.cn/categories/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/"/>
<category term="SQLServer" scheme="http://www.seanxia.cn/tags/SQLServer/"/>
<category term="数据库" scheme="http://www.seanxia.cn/tags/%E6%95%B0%E6%8D%AE%E5%BA%93/"/>
<category term="异常" scheme="http://www.seanxia.cn/tags/%E5%BC%82%E5%B8%B8/"/>
</entry>
<entry>
<title>记录一次生产数据库紧急恢复经历</title>
<link href="http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/f3ddb040.html"/>
<id>http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/f3ddb040.html</id>
<published>2024-07-19T16:00:00.000Z</published>
<updated>2024-08-10T07:22:13.465Z</updated>
<summary type="html"><h1><strong>事情经过</strong></h1>
<p> </summary>
<category term="日常问题" scheme="http://www.seanxia.cn/categories/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/"/>
<category term="数据库" scheme="http://www.seanxia.cn/tags/%E6%95%B0%E6%8D%AE%E5%BA%93/"/>
<category term="StarRocks" scheme="http://www.seanxia.cn/tags/StarRocks/"/>
<category term="恢复" scheme="http://www.seanxia.cn/tags/%E6%81%A2%E5%A4%8D/"/>
</entry>
<entry>
<title>Linux定时备份异常处理</title>
<link href="http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/64d019ba.html"/>
<id>http://www.seanxia.cn/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/64d019ba.html</id>
<published>2024-07-16T16:00:00.000Z</published>
<updated>2024-08-10T07:10:22.803Z</updated>
<summary type="html"><h1>问题场景</h1>
<p>为了<code>FineReport</code>数据决策平台服务器的安全性,前段时间做了定时备份,使用<code>Linux</code>的<code>crontab</code>定时任务每天凌晨将整个<code>FineReport</cod</summary>
<category term="日常问题" scheme="http://www.seanxia.cn/categories/%E6%97%A5%E5%B8%B8%E9%97%AE%E9%A2%98/"/>
<category term="Linux" scheme="http://www.seanxia.cn/tags/Linux/"/>
<category term="定时备份" scheme="http://www.seanxia.cn/tags/%E5%AE%9A%E6%97%B6%E5%A4%87%E4%BB%BD/"/>
</entry>
<entry>
<title>使用Git系统搭建GitLab</title>
<link href="http://www.seanxia.cn/%E5%85%B6%E4%BB%96/6d60df94.html"/>
<id>http://www.seanxia.cn/%E5%85%B6%E4%BB%96/6d60df94.html</id>
<published>2019-08-23T16:00:00.000Z</published>
<updated>2024-07-11T15:00:41.472Z</updated>
<summary type="html"><h3 id="Git、GitHub与GitLab区别">Git、GitHub与GitLab区别</h3>
<p>首先我们要知道的是,Git与GitLab不是一个东西,git是一个可以进行版本控制的操作工具,而GitLab则是一个用来托管文件的远程仓库。</p>
<p>GitLab与GitHub最大的区别就是可以使用自己的服务器进行托管,相比GitHub来说更安全高效,适合团队内部开发。</p></summary>
<category term="其他" scheme="http://www.seanxia.cn/categories/%E5%85%B6%E4%BB%96/"/>
<category term="Git" scheme="http://www.seanxia.cn/tags/Git/"/>
<category term="GitLab" scheme="http://www.seanxia.cn/tags/GitLab/"/>
</entry>
<entry>
<title>新浪微博图床迁移</title>
<link href="http://www.seanxia.cn/%E5%85%B6%E4%BB%96/7fb68dad.html"/>
<id>http://www.seanxia.cn/%E5%85%B6%E4%BB%96/7fb68dad.html</id>
<published>2019-08-10T16:00:00.000Z</published>
<updated>2024-07-15T02:11:23.701Z</updated>
<summary type="html"><p>前不久,微博图床挂了,这对于众多使用 Markdown 写技术博客的人简直太残忍了!看来,图片迁移真的是刻不容缓了,在我准备迁移图片的时候,发现了几个平台对图片不同的处理方式,觉得很有意思,所以记录一下。</p>
<p><strong>本人强烈推荐使用方法五,亲测有效。</strong></p></summary>
<category term="其他" scheme="http://www.seanxia.cn/categories/%E5%85%B6%E4%BB%96/"/>
<category term="图床" scheme="http://www.seanxia.cn/tags/%E5%9B%BE%E5%BA%8A/"/>
<category term="迁移" scheme="http://www.seanxia.cn/tags/%E8%BF%81%E7%A7%BB/"/>
</entry>
<entry>
<title>流式框架Flink(一)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/31afedf9.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/31afedf9.html</id>
<published>2019-01-01T16:00:00.000Z</published>
<updated>2019-08-10T13:46:34.000Z</updated>
<summary type="html"><p>Apache Flink是一个用于对无边界和有边界数据流进行有状态计算的框架和分布式处理引擎。Flink设计为运行在所有常见的集群环境中,并且以内存速度和任意规模执行计算。</p>
<p>官网:<a href="https://flink.apache.org">https://flink.apache.org</a></p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="流式处理" scheme="http://www.seanxia.cn/tags/%E6%B5%81%E5%BC%8F%E5%A4%84%E7%90%86/"/>
<category term="flink" scheme="http://www.seanxia.cn/tags/flink/"/>
</entry>
<entry>
<title>流式框架Flink(二)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/1b90121.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/1b90121.html</id>
<published>2019-01-01T16:00:00.000Z</published>
<updated>2024-07-11T14:48:50.981Z</updated>
<summary type="html"><p>Apache Flink是一个用于对无边界和有边界数据流进行有状态计算的框架。</p>
<p>我们来谈谈 Flink 的编程模型与部署。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="流式处理" scheme="http://www.seanxia.cn/tags/%E6%B5%81%E5%BC%8F%E5%A4%84%E7%90%86/"/>
<category term="flink" scheme="http://www.seanxia.cn/tags/flink/"/>
</entry>
<entry>
<title>SparkMLlib 随机森林</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/1ca1f555.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/1ca1f555.html</id>
<published>2018-05-21T16:00:00.000Z</published>
<updated>2024-07-11T14:40:00.799Z</updated>
<summary type="html"><p>一种非线性有监督分类模型</p>
<p>一种非线性有监督分类模型</p>
<p>随机森林是一种非线性有监督的分类模型。随机森林的决策树的升级版,由多个随机数据集的决策树组合而成。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="机器学习" scheme="http://www.seanxia.cn/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="随机森林" scheme="http://www.seanxia.cn/tags/%E9%9A%8F%E6%9C%BA%E6%A3%AE%E6%9E%97/"/>
</entry>
<entry>
<title>SparkMLlib 逻辑回归</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/a4a0dc78.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/a4a0dc78.html</id>
<published>2018-05-14T16:00:00.000Z</published>
<updated>2024-07-11T14:51:55.618Z</updated>
<summary type="html"><p>逻辑回归是预测分类响应的常用方法。这是<a href="https://en.wikipedia.org/wiki/Generalized_linear_model">广义线性模型的</a>一个特例,可以预测结果的概率。</p>
<p>在<code>spark.ml</code>逻辑回归中,可以使用二项逻辑回归来预测二元结果,或者可以使用多项逻辑回归来预测多类结果。使用该<code>family</code> 参数在这两种算法之间进行选择,或者保持不设置,Spark将推断出正确的变量。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="机器学习" scheme="http://www.seanxia.cn/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="逻辑回归" scheme="http://www.seanxia.cn/tags/%E9%80%BB%E8%BE%91%E5%9B%9E%E5%BD%92/"/>
</entry>
<entry>
<title>SparkMLlib线性回归</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/30277e10.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/30277e10.html</id>
<published>2018-05-11T16:00:00.000Z</published>
<updated>2024-07-11T14:41:36.825Z</updated>
<summary type="html"><p>关于机器学习,Spark MLlib中也对相关算法有API的讲解,本章介绍线性回归算法。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="机器学习" scheme="http://www.seanxia.cn/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="线性回归" scheme="http://www.seanxia.cn/tags/%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92/"/>
</entry>
<entry>
<title>SparkMLlib Kmeans聚类</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/31efd837.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/31efd837.html</id>
<published>2018-05-09T16:00:00.000Z</published>
<updated>2024-07-11T14:08:00.943Z</updated>
<summary type="html"><p>Kmeans聚类算法又叫K均值聚类。</p>
<p>聚类:给事物打标签,寻找同一组内的个体之间的一些潜在的相似模式。力图找到数据的自然分组 kmeans。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="机器学习" scheme="http://www.seanxia.cn/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="Kmeans" scheme="http://www.seanxia.cn/tags/Kmeans/"/>
</entry>
<entry>
<title>SparkMLlib贝叶斯分类</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/800c7c16.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/800c7c16.html</id>
<published>2018-05-05T16:00:00.000Z</published>
<updated>2024-07-11T14:09:48.890Z</updated>
<summary type="html"><p>机器学习算法中,有种依据概率原则进行分类的朴素贝叶斯算法,正如气象学家预测天气一样,朴素贝叶斯算法就是应用先前事件的有关数据来估计未来事件发生的概率。如:70%降水概率。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="机器学习" scheme="http://www.seanxia.cn/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"/>
<category term="贝叶斯分类" scheme="http://www.seanxia.cn/tags/%E8%B4%9D%E5%8F%B6%E6%96%AF%E5%88%86%E7%B1%BB/"/>
</entry>
<entry>
<title>Spark性能优化</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/91aae295.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/91aae295.html</id>
<published>2018-02-19T16:00:00.000Z</published>
<updated>2024-07-11T14:52:10.655Z</updated>
<summary type="html"><p>关于Spark,在实际工作中有很多需要去优化的地方。本篇文章将给出一些需要手动去调整的配置供大家参考。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="优化" scheme="http://www.seanxia.cn/tags/%E4%BC%98%E5%8C%96/"/>
<category term="Spark" scheme="http://www.seanxia.cn/tags/Spark/"/>
</entry>
<entry>
<title>Spark计算框架(六)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/2e9b7b1c.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/2e9b7b1c.html</id>
<published>2018-02-02T16:00:00.000Z</published>
<updated>2019-08-10T13:45:52.000Z</updated>
<summary type="html"><p>SparkStreaming 是流式处理框架,是 Spark API 的扩展,支持可扩展、高吞吐、容错的实时数据流处理。</p>
<p>实时数据的来源可以是:Kafka,Flume,Twitter,ZeroMQ 或者 TCP sockets,并且可以使用高级功能的复杂算子来处理流数据。例如:map,reduce,join,window 。最终,处理后的数据可以存放在文件系统,数据库等,方便实时展现。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="SparkStreaming" scheme="http://www.seanxia.cn/tags/SparkStreaming/"/>
<category term="流式处理" scheme="http://www.seanxia.cn/tags/%E6%B5%81%E5%BC%8F%E5%A4%84%E7%90%86/"/>
</entry>
<entry>
<title>Spark计算框架(五)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/4b9530c5.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/4b9530c5.html</id>
<published>2018-01-20T16:00:00.000Z</published>
<updated>2019-08-10T13:45:44.000Z</updated>
<summary type="html"><p>Spark SQL 是 Spark 处理数据的一个模块,跟基本的 Spark RDD 的API不同,Spark SQL中提供的接口将会提供给Spark 更多关于结构化数据和计算的信息。其本质是,Spark SQL使用这些额外的信息去执行额外的优化。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="SparkSQL" scheme="http://www.seanxia.cn/tags/SparkSQL/"/>
<category term="DataFrame" scheme="http://www.seanxia.cn/tags/DataFrame/"/>
</entry>
<entry>
<title>SparkShuffle调优</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/3243dc0c.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/3243dc0c.html</id>
<published>2018-01-15T16:00:00.000Z</published>
<updated>2019-08-10T13:45:30.000Z</updated>
<summary type="html"><p>SparkShuffle在使用时,默认的配置中有些配置可能不适合实际中的业务处理,需要我们手动进行调整优化。这里列举了一些常用的 SparkShuffle 调优策略和建议。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="SparkShuffle" scheme="http://www.seanxia.cn/tags/SparkShuffle/"/>
<category term="调优" scheme="http://www.seanxia.cn/tags/%E8%B0%83%E4%BC%98/"/>
</entry>
<entry>
<title>Spark计算框架(四)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/240bf582.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/240bf582.html</id>
<published>2018-01-15T16:00:00.000Z</published>
<updated>2024-07-11T14:43:37.500Z</updated>
<summary type="html"><p>我们知道 Spark 的基本架构是 Master 和 Worker 组成的,Task 的分配和执行又是由 Driver 进程和 Excutor 进程</p>
<p>去配合完成的,那关于他们内部是怎么运行的,有哪些对象呢,这里将 做详细阐述。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="SparkShuffle" scheme="http://www.seanxia.cn/tags/SparkShuffle/"/>
<category term="广播变量" scheme="http://www.seanxia.cn/tags/%E5%B9%BF%E6%92%AD%E5%8F%98%E9%87%8F/"/>
</entry>
<entry>
<title>Spark计算框架(三)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/9326ece7.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/9326ece7.html</id>
<published>2018-01-07T16:00:00.000Z</published>
<updated>2019-08-10T13:45:46.000Z</updated>
<summary type="html"><p>关于 Spark 算子的应用案例有很多,这里介绍一些一些不常见但是很有用的算子,以及几个小案例的源码介绍。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="spark" scheme="http://www.seanxia.cn/tags/spark/"/>
<category term="PV" scheme="http://www.seanxia.cn/tags/PV/"/>
<category term="PU" scheme="http://www.seanxia.cn/tags/PU/"/>
</entry>
<entry>
<title>Spark计算框架(二)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/de384fb5.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/de384fb5.html</id>
<published>2017-12-18T16:00:00.000Z</published>
<updated>2019-08-10T13:45:42.000Z</updated>
<summary type="html"><p>关于Spark的任务提交方式,总的分为 Client 提交和 Cluster 提交两种。这里以 Standalone 和 Yarn 为例详细阐述他们在 Spark 中提交任务的流程。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="spark" scheme="http://www.seanxia.cn/tags/spark/"/>
<category term="任务提交" scheme="http://www.seanxia.cn/tags/%E4%BB%BB%E5%8A%A1%E6%8F%90%E4%BA%A4/"/>
</entry>
<entry>
<title>Spark计算框架(一)</title>
<link href="http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/53ca074f.html"/>
<id>http://www.seanxia.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE/53ca074f.html</id>
<published>2017-12-15T16:00:00.000Z</published>
<updated>2019-08-10T13:45:40.000Z</updated>
<summary type="html"><p>Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。</p>
<p>Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架。</p></summary>
<category term="大数据" scheme="http://www.seanxia.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
<category term="spark" scheme="http://www.seanxia.cn/tags/spark/"/>
<category term="分布式计算" scheme="http://www.seanxia.cn/tags/%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%A1%E7%AE%97/"/>
</entry>
</feed>