flink RichFunction之坑及解决
投稿:jingxian
flink RichFunction之坑
flink的RichMapFunction,RichSinkFunction等,并不能百分百做到每次只open一个数据库连接。
在有些情况下他会一直创建然后销毁,创建销毁。
举例: 重点在第三行的注释
val value = env.socketTextStream("192.168.13.11", 9090) val value2 = value.filter(x => { try { var a = 1 / 0 //此处若没有异常处理,任务不会断,但是会重复打开数据库连接 } catch { case e: Exception => } isInter(x) }).map(fun = x => { x.toLong }) val value1 = value2.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor[Long](Time.seconds(1)) { override def extractTimestamp(element: Long): Long = { println(element + "***************") element } }) try { var a = 1 / 0 } catch { case e: Exception => } value1.map(new mymap) env.execute("test") } def isInter(input: String): Boolean = { val matcher = Pattern.compile("^[0-9]+$").matcher(input) matcher.find() } } class myRichMapfun6() extends RichMapFunction[ListBuffer[String], Unit] { var conn: Connection = _ var pst: PreparedStatement = _ override def open(parameters: Configuration): Unit = { conn = DriverManager.getConnection("jdbc:mysql://xxxxxxx:3306/zzt?useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull&useSSL=false&autoReconnect=true", "root", "bigdata@mysql") println(conn) pst = conn.prepareStatement("insert into testa (str) values (?)") } override def close(): Unit = { conn.close() pst.close() } override def map(in: ListBuffer[String]): Unit = { pst.setString(1, in.head) pst.execute() } }
所以你是不是觉得那就价格异常处理不就得了?
NO
再看:
这个时候,如果传进来line不是数字或者格式不对,就会触发异常,然而此时就不会像上面那样帮你解决问题,而是一遍遍创建对象销毁对象,一条消息创建一个连接,我就问你慌不慌,
原因
据观察是因为,输入的数据有问题,直接导致
val value1 = value2.assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor[Long](Time.seconds(1)) { override def extractTimestamp(element: Long): Long = { println(element + "***************") element } })
这个崩溃了,不走这行代码了,没有获得eventime,然后估计。。。 剩下的我也没详细测。。。
解决方案
先fiiter过滤任何可能导致异常的脏数据确保数据都没问题就可以了。
flink中RichFunction的一点小作用
①传递参数
所有需要用户定义的函数都可以转换成richfunction,例如实现map operator中你需要实现一个内部类,并实现它的map方法:
data.map (new MapFunction<String, Integer>() { public Integer map(String value) { return Integer.parseInt(value); } });
然后我们可以将其转换为RichMapFunction:
data.map (new RichMapFunction<String, Integer>() { public Integer map(String value) { return Integer.parseInt(value); } });
当然,RichFuction除了提供原来MapFuction的方法之外,还提供open, close, getRuntimeContext 和setRuntimeContext方法,这些功能可用于参数化函数(传递参数),创建和完成本地状态,访问广播变量以及访问运行时信息以及有关迭代中的信息。
下面我们来看看RichFuction中传递参数的例子,以下代码是测试RichFilterFuction的例子,基于DataSet而非DataStream。
由代码可见,可以将Configuration中的limit参数的值传递进RichFuction里面,通过后面withParameters方法传递进去,最后的结果是
由此可见,我从configuration中获取了limit的值,并设定了fliter的阈值是2,从而过滤了1,2。
②传递广播变量
原理和上面差不多,下面我直接把代码贴出来:
这是目前我学习到的RichFunction的用法,和大家分享一下。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。