码迷,mamicode.com
首页 > 其他好文 > 详细

hive中 regexp_replace的用法,替换特殊字符问题

时间:2018-11-07 20:44:55      阅读:1390      评论:0      收藏:0      [点我收藏+]

标签:operator   换行   def   note   play   uri   string   用法   数据   

数据仓库中有的字段不合格,有特殊字符,比如换行符。

poi_name
\n19013
\n12013

怎么把换行符替换掉呢?

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-StringOperators

regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT)

Returns the string resulting from replacing all substrings in INITIAL_STRING that match the java regular expression syntax defined in PATTERN with instances of REPLACEMENT. For example, regexp_replace("foobar", "oo|ar", "") returns ‘fb.‘ Note that some care is necessary in using predefined character classes: using ‘\s‘ as the second argument will match the letter s; ‘\s‘ is necessary to match whitespace, etc.

官网说用两个反斜杠代替一个,即一个反斜杠用来转义。

实践了一下,不行,得4个

````
select regexp_replace(poi_name,‘\\n‘,‘‘)

poi_name
19013
12013
```

hive中 regexp_replace的用法,替换特殊字符问题

标签:operator   换行   def   note   play   uri   string   用法   数据   

原文地址:https://www.cnblogs.com/woshimrf/p/hive-string-regexp-replace-usage.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!