收藏本站 收藏本站
積木網首頁 - 軟件測試 - 常用手冊 - 站長工具 - 技術社區
首頁 > python > 正文

首頁 - PHP - 數據庫 - 操作系統 - 游戲開發 - JS - Android - MySql - Redis - MongoDB - Win8 - Shell編程 - DOS命令 - jQuery - CSS樣式 - Python - Perl

Access - Oracle - DB2 - SQLServer - MsSql2008 - MsSql2005 - Sqlite - PostgreSQL - node.js - extjs - JavaScript vbs - Powershell - Ruby

Python正則表達式匹配中文用法示例

本文實例講述了Python正則表達式匹配中文用法。分享給大家供大家參考,具體如下:

#!/usr/bin/python
#-*- coding:cp936-*-#思路,將str轉換成unicode,方可用正則表達式,前提是,要知道文件的編碼,本例中是gbk
import cPickle as mypickle
import re
import sys
if (__name__=='__main__'):
  fid1=file('demo.txt','r');#demo.txt寫入字符如:積木網
  p=re.compile('(^s+|s+$)');
  phanzigbk=re.compile('[\x20-\x7f]');
  phanzi=re.compile(u'[u4e00-u9fa5]');#這里要加u,注意
  commlines=fid1.readlines();
  fid1.close();
  dictfamilyname={};
  dictfirstname={};
  for line in commlines:
    line=p.sub('',line);
    print type(line);
    print line;
    uline=unicode(line,'gbk');
    print type(uline);
    candidates=phanzi.findall(uline);
    print len(candidates);
    if(len(candidates)==2):
      print candidates[0];
      familynamegbk=candidates[0].encode('gbk');#把unicode型的變量變成str型的變量
      firstnamegbk=candidates[1].encode('gbk');
      if(dictfamilyname.has_key(familynamegbk)):
        dictfamilyname[familynamegbk]=dictfamilyname[familynamegbk]+1;
      else:
        dictfamilyname[familynamegbk]=1;
      if(dictfirstname.has_key(firstnamegbk)):
        dictfirstname[firstnamegbk]=dictfirstname[firstnamegbk]+1;
      else:
        dictfirstname[firstnamegbk]=1;
  familynameitems=dictfamilyname.items();
  print familynameitems;
  firstnameitems=dictfirstname.items();
  familynameitems.sort(key=lambda d:d[1],reverse=True);
  firstnameitems.sort(key=lambda d :d[1],reverse=True);
  fid=file('familyname.txt','w');
  for m in familynameitems:
    s=m[0]+'t'+str(m[1]);
    fid.write(s);
    fid.write('n');
  fid.close();
  fid=file('firstname.txt','w');
  for m in firstnameitems:
    s=m[0]+'t'+str(m[1]);
    fid.write(s);
    fid.write('n');
  fid.close();
  print 'finish'

運行效果圖如下:

查看圖片

PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:

JavaScript正則表達式在線測試工具:
http://tools.gimoo.net/regex/javascript

正則表達式在線生成工具:
http://tools.gimoo.net/regex/create_reg

更多關于Python相關內容可查看本站專題:《Python正則表達式用法總結》、《Python數據結構與算法教程》、《Python Socket編程技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

Python獲取某一天是星期幾的方法示例
本文實例講述了Python獲取某一天是星期幾的方法。分享給大家供大家參考,具體如下:這里以2017年的春節(1月28號)為例:importre;importtime;importdatetime;if

python 基礎教程之Map使用方法
PythonMapMap會將一個函數映射到一個輸入列表的所有元素上。Map的規范為:map(function_to_apply,list_of_inputs)大多數時候,我們需要將列表中的所有元素一個個

ansible作為python模塊庫使用的方法實例
前言ansible是新出現的自動化運維工具,基于Python開發,集合了眾多運維工具(puppet、cfengine、chef、func、fabric)的優點,實現了批量系統配置、批量程序

本周排行

更新排行

強悍的草根IT技術社區,這里應該有您想要的! 友情鏈接:b2b電子商務
Copyright © 2010 Gimoo.Net. All Rights Rreserved  京ICP備05050695號
上海时时乐基本走势综合版