2019-07-24 17:51 已编辑华为_2012实验室_Java工程师

关注

Apache Flink实战(二) - 第一个Flink应用程序

动手搭建Flink的开发环境，快速使用Java和Scala语言开发第一个基于Flink的批处理和流式处理的应用程序。

下载安装

brew install apache-flink

1 需求描述

Flink开发批处理应用程序

需求:词频统计(word count)

一个文件，统计文件中每个单词出现的次数
分隔符是\t
统计结果我们直接打印在控制台(生产上肯定是Sink到目的地)

实现:

Flink + Java
Flink + Scala

2 Java开发之环境准备

2.1 Maven构建

2.1.1 Requirements

唯一的要求是Maven 3.0.4（或更高版本）和 Java 8.x 安装

2.1.2 Create Projec

使用以下命令之一创建项目：

maven archetype

 $ mvn archetype:generate                               \
      -DarchetypeGroupId=org.apache.flink              \
      -DarchetypeArtifactId=flink-quickstart-java      \
      -DarchetypeVersion=1.8.0

这允许您为新创建的项目命名。它将以交互方式询问您groupId，artifactId和包名称。

Run the quickstart script

  $ curl https://flink.apache.org/q/quickstart.sh | bash -s 1.8.0

2.1.3 Inspect Project

您的工作目录中将有一个新目录。如果您使用了curl方法，则该目录称为quickstart。否则，它具有artifactId的名称：

使用IDEA打开该项目即可!

示例项目是一个Maven项目，它包含两个类：StreamingJob和BatchJob是DataStream和DataSet程序的基本框架程序。
主要方法是程序的入口点，既可用于IDE测试/执行，也可用于正确部署。
建议将此项目导入IDE以进行开发和测试。 IntelliJ IDEA支持开箱即用的Maven项目。
不建议Eclipse

请注意：对于Flink，Java的默认JVM堆可能太小。你必须手动增加它。在IntelliJ IDEA中，推荐的更改JVM选项的方法来自Help | 编辑自定义VM选项菜单 -Xmx800m

2.1.4 Build Project

如果要构建/打包项目，请转到项目目录并运行

mvn clean package

或者使用插件

您将找到包含应用程序的JAR文件，以及可能已作为依赖项添加到应用程序的连接器和库：

target / <artifact-id>  -  <version> .jar

注意：如果您使用与StreamingJob不同的类作为应用程序的主类/入口点，我们建议您相应地更改pom.xml文件中的mainClass设置。这样，Flink可以从JAR文件运行应用程序，而无需另外指定主类。

3 公式型编程

step 1 : set up the batch execution environment
step 2 : Start with getting some data from the environment, like

env.readTextFile(textPath);

step 3 : 开发业务逻辑的核心代码
transform the resulting DataSet using operations,like

.filter()
.flatMap()
.join()
.coGroup()

step 4 : execute program

4 Flink批处理应用Java开发之功能实现

在相应的目录下建立文本
测试代码
成功读取

4.1 功能拆解

1）读取数据

Hello JavaEdge

2）每一行的数据按照指定的分隔符拆分

Hello
JavaEdge

3）为每一个单词赋上次数为1

(Hello,1)
(JavaEdge,1)

4) 合并操作

groupBy

代码
结果

5 Scala开发之环境准备

要求与Java环境基本类似,不再赘述
Maven构建

6 批处理应用Scala功能实现

实现代码
内容正确打印

7 实时处理应用Java开发之功能实现

代码

可能遇到拒绝连接,记得

nc -lk 9999

清除运行结果
socket数据
结果

9 Flink实时处理应用Java开发之代码重构

如何才能突破端口被限制呢，需要如下重构：

传入参数args
获得参数

10 实时处理应用Scala开发之代码重构

11 开发过程中依赖的注意事项

Configuring Dependencies, Connectors, Libraries

每个Flink应用程序都依赖于一组Flink库。至少，应用程序依赖于Flink API。许多应用程序还依赖于某些连接器库（如Kafka，Cassandra等）。运行Flink应用程序时（在分布式部署中或在IDE中进行测试），Flink运行时库也必须可用。

X 交流学习

Java交流群

博客

Github

全部评论

推荐最新楼层

07-17 12:04

中国矿业大学热设计工程师

海尔秋招挂

一面没问任何专业问题，都是问为什么想来，对他们的了解感觉没啥问题，表达想去等意愿，但是寄了...

海尔一面23人在聊

点赞评论收藏

07-16 21:55

网易互娱_图形开发工程师(准入职员工)

网易互娱内推，网易互娱内推

面经：网申方向填的系统一段中厂策划实习 战斗执行+系统+UI笔试互娱今年是统招 笔试4选3 答了系统战斗数值（数值没做完..）一面两个面试官40min主要围绕实习经历、游戏具体设计分析这两块聊。实习经历都是比较常见的能准备到的问题不多说了游戏这块1经典问题最近/这半年玩了什么游戏提了鸣潮并简单聊了 鸣潮/原神的声骸/圣遗物 系统对比被追问鸣潮为什么要做在大世界的声骸获取、目前系统有哪些体验/设计问题、如何改进介绍一个你觉得比较有趣的玩法提了一个最近玩的rouge（雪居之地）对照尖塔描述了玩法流程和战斗系统上的不同网易游戏（互娱）2026届校园招聘启动啦内推福利推荐(仅限第一志愿)直通笔试或简历...

点赞评论收藏

06-21 01:03

门头沟学院 Java

家人们，梦彻底醒了

双非一本，大三下了，今天第一次面试，项目是编的，一问直接露馅了，昨天开始背的八股文，今天全忘了，大学三年确实是玩爽了，今天面试完彻底觉悟了，现在目标秋招了，暑期实习是指望不上了，兄弟们有没有好的建议，本人孙吧七年吧龄，请狠狠压力我，我都能听得进去的

黎寻汐：先别面试了，赶紧扒两个项目吧，八股文也要过一遍。我动态里面的那些面经都是小公司，你看过去一遍能应付哪个？现在开始每天学8小时，还有机会

还记得你第一次面试吗？

点赞评论收藏

06-02 19:23

华南理工大学 Java

友友们看看简历，不玻璃心求拷打

五月中才醒悟，现在才学15天，项目全是网上烂大街项目，每天晚上都失眠😭，六月还有机会找到实习吗

屌丝逆袭咸鱼计划：心态摆好，man，晚点找早点找到最后都是为了提升自己好进正职，努力提升自己才是最关键的😤难道说现在找不到找的太晚了就炸了可以鸡鸡了吗😤早实习晚实习不都是为了以后多积累，大四学长有的秋招进的也不妨碍有的春招进，人生就这样

点赞评论收藏

07-16 22:05

韶音科技_产品事业部_产品经理(准入职员工)

韶音科技内推

2024-06-08，投递简历：提前批-机械结构工程师2024-06-30，专业笔试：使用的牛客题库，20道选择题+2道简答题，考察范围包括机设、机原、材料、力学、工艺等2024-07-24，HR面试邀约2024-08-02，HR面试，腾讯会议，约20min。面试流程如下：    1. 自我介绍    2. 人事问答：    （1）你的研究方向？你们课题组的研究方向有哪些？    （2）分工？    （3）项目简述：项目背景？解决什么问题？你做了哪些工作？结构怎样设计的？工作过程中有探索性学习？动手实践吗？项目进展？    （4）实验室有多少人？    （5）博士有吗？    （6）做项目会有...

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 假如你的老板掉河里，你的工作能为他做什么 #

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

118456次浏览 814人参与

Apache Flink实战(二) - 第一个Flink应用程序

相关源码

下载安装

1 需求描述

Flink开发批处理应用程序

需求:词频统计(word count)

实现:

2 Java开发之环境准备

2.1 Maven构建

2.1.1 Requirements

2.1.2 Create Projec

maven archetype

Run the quickstart script

2.1.3 Inspect Project

2.1.4 Build Project

3 公式型编程

4 Flink批处理应用Java开发之功能实现

4.1 功能拆解

1）读取数据

2）每一行的数据按照指定的分隔符拆分

3）为每一个单词赋上次数为1

4) 合并操作

5 Scala开发之环境准备

6 批处理应用Scala功能实现

7 实时处理应用Java开发之功能实现

9 Flink实时处理应用Java开发之代码重构

10 实时处理应用Scala开发之代码重构

11 开发过程中依赖的注意事项

Configuring Dependencies, Connectors, Libraries

X 交流学习

Java交流群

博客

Github

全站热榜

创作者周榜