码迷,mamicode.com
首页 > 数据库 > 详细

Python日常实践(1)——SQL Prompt的Snippets批量整理

时间:2016-12-13 19:25:31      阅读:366      评论:0      收藏:0      [点我收藏+]

标签:replace   type   读取   功能   批量   需要   rip   存储   区分大小写   

  引言

    个人平时在写sql脚本的时候会使用到SQL Prompt这款插件,除了强大的智能提示和格式化sql语句功能,我还喜欢使用Snippets代码段功能。比如我们可以在查下分析器输入ssf后按Tab键,SQL Prompt就可以帮我们快速的输入SELECT  * FROM 。

技术分享

    但是个人不习惯看大写的sql代码,所以就想捣鼓着将代码段输出的代码变成小写。打开代码段管理界面,发现管理工具提供了编辑代码段的功能,但是如果要一个个的编辑,自行转换成小写,再保存,那显然不是咱的风格。可以看到SQL Prompt存放代码段的路径:

技术分享

    找到路径中的文件打开可以看到,代码段文件是一个扩展名为sqlpromptsnippet的xml文件。

技术分享

    所以想着使用python来批量的将代码段文件中的代码转换成小写。

 

  一. xml操作——找到Code节点并获取代码段的sql语句

    1. xml格式文件节点类型详细介绍可以参考   W3School教程 

    2. python中读写xml文件可以使用mxl.dom.minidom模块,查找Code节点代码如下:

import xml.dom.minidom

snippet = xml.dom.minidom.parse(ssf.sqlpromptsnippet)
root = snippet.documentElement
print(root.nodeType,root.nodeName,root.nodeValue)

code = snippet.getElementsByTagName(Code)[0]
print(code.nodeType,code.nodeName,code.nodeValue)

    snippet = xml.dom.minidom.parse(ssf.sqlpromptsnippet) :表示打开当前路径中名为ssf.sqlpromptsnippet的xml文件,并把xml文件对象赋值给snippet对象。

    root = snippet.documentElement :表示获取snippet对象的文档元素(根节点),并把获得的对象给root。

    code = snippet.getElementsByTagName(Code)[0]  :表示查找root根节点下面所有名为Code的子元素,并将第一个子元素赋值给code对象。

    执行结果:

1 CodeSnippets None
1 Code None 

    因为CodeSnippets和Code节点都不是文本节点,所有其nodeValue属性为None。Code节点为1个 CDATASection节点,其有以下属性:

技术分享

    所以找到Code节点并获取代码段的sql语句的正确语句如下:

import xml.dom.minidom

snippet = xml.dom.minidom.parse(ssf.sqlpromptsnippet)
root = snippet.documentElement
#print(root.nodeType,root.nodeName,root.nodeValue)
code = snippet.getElementsByTagName(Code)[0]
#print(code.nodeType,code.nodeName,code.nodeValue)
statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点
print (statement) 

    执行结果:

SELECT * FROM

 

  二. sql代码转换操作——大写转小写

    1. sql语句大写转小写,可以直接使用str类的lower函数即可:

statementlower = statement.lower()
print (statementlower)

    执行结果

select * from

    2. SQL Prompt中有部分代码段是含有占位符的,占位符的格式为”$CURSOR$”,而且其是区分大小写的,所以占位符不能转换成小写。所以需要先将代码段中个sql语句中的占位符全部找出来,并存储起来,在sql语句转换成小写之后替换回去。

     因为占位符都是以“$”开头,也以“$”结尾,所以我们可以很方便的使用正则表达式来查找sql语句中的所有占位符。查找出来之后先将占位符和其小写形式使用dict存储起来。

import xml.dom.minidom
import re

snippet = xml.dom.minidom.parse(ct.sqlpromptsnippet)
root = snippet.documentElement
#print(root.nodeType,root.nodeName,root.nodeValue)
code = snippet.getElementsByTagName(Code)[0]
#print(code.nodeType,code.nodeName,code.nodeValue)
statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) 
print (statement) # 输出原语句

# 正则查找所有的占位符
keylist = re.findall("\$\w+\$",statement) 
# 将占位符和其小写形式存储成字典
placeholds = dict() 
for key in keylist: 
    placeholds[key] = key.lower()

print(placeholds)

# 先将语句转换成小写
statementlower = statement.lower()

# 循环占位符字典,替换回占位符
for k,v in placeholds.items():
    statementlower = statementlower.replace(v,k)

print (statementlower)

    执行结果:

CREATE TABLE $table_name$
(
    $CURSOR$
)
{$table_name$: $table_name$, $CURSOR$: $cursor$}
create table $table_name$
(
    $CURSOR$
)

 

  三. xml操作——将转换代码写回xml文件

    xml写操作使用的是writexml文件,具体代码如下:

import xml.dom.minidom
import re

snippet = xml.dom.minidom.parse(ct.sqlpromptsnippet)
root = snippet.documentElement
#print(root.nodeType,root.nodeName,root.nodeValue)
code = snippet.getElementsByTagName(Code)[0]
#print(code.nodeType,code.nodeName,code.nodeValue)
statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) 
keylist = re.findall("\$\w+\$",statement)
placeholds = dict()
for key in keylist:
    placeholds[key] = key.lower()

statementlower = statement.lower()

for k,v in placeholds.items():
    statementlower = statementlower.replace(v,k)

#更新XML对象
code.firstChild.data = statementlower

# 打开文件对象,再写入
f = open(result\ct.sqlpromptsnippet, w,encoding = utf-8)
snippet.writexml(f, addindent=‘‘, newl=‘‘,encoding=utf-8)
f.close()

    执行结果生成文件对比:

技术分享

 

  四. 批量操作——循环代码段文件批量处理

    1. 循环目录下的文件,使用的是os模块的listdir方法。

>>> import os
>>> os.listdir()
[DLLs, Doc, include, Lib, libs, LICENSE.txt, NEWS.txt, python.exe, python3.dll, python35.dll, pythonw.exe, README.txt, Scripts, tcl, Tools, vcruntime140.dll]

     2. 先将单个转换封装成方法sqllower,再循环读取目录下的代码段文件即可完成批量处理,完整代码如下:

import xml.dom.minidom
import re
import os

def sqllower(name):
    snippet = xml.dom.minidom.parse(name)
    root = snippet.documentElement
    #print(root.nodeType,root.nodeName,root.nodeValue)
    code = snippet.getElementsByTagName(Code)[0]
    #print(code.nodeType,code.nodeName,code.nodeValue)
    statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) 
    #print (statement)

    keylist = re.findall("\$\w+\$",statement)
    placeholds = dict()
    for key in keylist:
        placeholds[key] = key.lower()

    #print(placeholds)
    statementlower = statement.lower()

    for k,v in placeholds.items():
        statementlower = statementlower.replace(v,k)

    #print (statementlower)

    #更新XML对象
    code.firstChild.data = statementlower

    f = open(result\\ + name, w,encoding = utf-8)
    snippet.writexml(f, addindent=‘‘, newl=‘‘,encoding=utf-8)
    f.close()

# 循环进行转换
for f in os.listdir():
    if f.endswith(.sqlpromptsnippet):
        print(正在转换+ f)
        sqllower(f)

print (所有转换完成。)

 

  五. 总结

    本文从日常使用中提取出sql代码段大小写转换的需求,将其使用Python实现。使用到了如下的模块:

    1. xml.dom.minidom模块,用来读写xml文件。

    2. re模块,使用了正则表达式,查询所有的占位符。

    3. os模块,使用listdir方法来循环目录中个文件。

Python日常实践(1)——SQL Prompt的Snippets批量整理

标签:replace   type   读取   功能   批量   需要   rip   存储   区分大小写   

原文地址:http://www.cnblogs.com/sesshoumaru/p/6170836.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!