博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python3随机生成中文字符
阅读量:6431 次
发布时间:2019-06-23

本文共 648 字,大约阅读时间需要 2 分钟。

运行环境在Python3.6下,Python2的解决方案网上有很多. ---2017.10.18

第一种方法:Unicode码

在unicode码中,汉字的范围是(0x4E00, 9FBF)

import randomdef Unicode():    val = random.randint(0x4e00, 0x9fbf)    return chr(val)

这个方法比较简单,但是有个小问题,unicode码中收录了2万多个汉字,包含很多生僻的繁体字.

第二种方法:GBK2312

gbk2312对字符的编码采用两个字节相组合,第一个字节的范围是0xB0-0xF7, 第二个字节的范围是0xA1-0xFE.

对GBK2312编码方式详细的解释请参看

import randomdef GBK2312():    head = random.randint(0xb0, 0xf7)    body = random.randint(0xa1, 0xf9)   # 在head区号为55的那一块最后5个汉字是乱码,为了方便缩减下范围    val = f'{head:x}{body:x}'    str = bytes.fromhex(val).decode('gb2312')    return str

GBK2312收录了6千多常用汉字.两种方法的取舍就看需求了.

另外推荐一篇

转载于:https://www.cnblogs.com/thunderLL/p/7682148.html

你可能感兴趣的文章
Java --- 多线程 面试题
查看>>
OA项目如何成功实施!
查看>>
FindMaxConsecutive.java
查看>>
面试官问:ZooKeeper 一致性协议 ZAB 原理
查看>>
DNS实现域名正解与反解
查看>>
反向教学系列之——Django入门(一)【不需知道web框架】
查看>>
Linux学习-标准输入输出
查看>>
CentOS 7 配置IP
查看>>
文本处理工具grep及正则表达式
查看>>
Intel VT-x处于禁用状态
查看>>
用什么软件可以修改PDF文件,软件的操作方法
查看>>
如何精简企业主数据“裹脚布”
查看>>
Pointer on C
查看>>
& 号和管道符号(|)在不同场景下的使用方法
查看>>
curl 浏览器模拟请求实战
查看>>
多个VLAN中的vrrp备份组配置举例
查看>>
运维自动化之使用PHP+MYSQL+SHELL打造私有监控系统(六)
查看>>
interlib在tomcat7.0的安装
查看>>
水晶报表在大型WEB内部管理系统里的滑铁卢
查看>>
我的友情链接
查看>>