登陆

极彩娱乐在线平台-关于python编码,你究竟了解多少?快来看看自己的水平

admin 2020-02-14 241人围观 ,发现0个评论

计算机存储的几个概念


想要完全搞清楚编码问题,咱们必需求先搞清楚计算机是怎样存储数据的,这就触及到了计算机根底的几个概念了,开篇咱们就先来捋捋这几个简略混杂的概念。

bit

二进制位, 是计算机内部数据贮存的最小单位,11010100是一个8位二进制数。一个二进制位只能够表明0和1两种状况(2^1);两个二进制位能够表明00、01、10、11四种(2^2)状况;三位二进制数可表明八种状况(2^3)……

Byte

字节,是计算机中数据处理的基本单位,计算机中以字节为单位存储和解说信息,规则一个字节由八个二进制位构成,即1个字节等于8个比特(1Byte=8bit)。八位二进制数最小为00000000,最大为11111111;一般1个字节能够存入一个ASCII码,2个字节能够寄存一个汉字国标码。

在计算机中,一串数码作为一个全体来处理或运算的,称为一个计算机字,简称宇。字一般分为若干个字节(每个字节一般是8位)。在存储器中,一般每个单元存储一个字,因而每个字都是能够寻址的。字的长度用位数极彩娱乐在线平台-关于python编码,你究竟了解多少?快来看看自己的水平来表明。在计算机的运算器、控制器中,一般都是以字为单位进行传送的。

字长

字长:电脑技术中对CPU在单位时刻内(同一时刻)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU一般就叫8位的CPU。同理32位的CPU就能在单位时刻内处理字长为32位的二进制数据。

字节和字长的差异:因为常用的英文字符用8位二进制就能够表明极彩娱乐在线平台-关于python编码,你究竟了解多少?快来看看自己的水平,所以一般就将8位称为一个字节。字长的长度是不固定的,关于不同的CPU、字长的长度也不相同。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次能够处理8个字节。

常见的编码

ASCII: 1个字节,只编码英文字母和符号

gb2312: 2个字节,增加了中文汉字和符号

Unicode: 把一切言语都一致到一套编码里把一切言语都一致到一套编码里,

一般是2个字节,冷僻字4个字节

utf-8: 可变长编码,常用的英文字母被编码成1个字节,汉字一般是3个字节,只要很冷僻的字符才会被编码成4-6个字节。假如你要传输的文本包括许多英文字符,用UTF-8编码就能节约空间:

在计算机内存中,一致运用Unicode编码,当需求保存到硬盘或许需求传输的时分,就转化为UTF-8编码,这样能够节约许多存储空间。

Python编码

注:这儿评论的是python2.7的状况

两个函数

在python中,str和unicode都是basestring的子类,basestring有以下两个办法:

encode(): 将unicode字符串转化为其他编码字符串,参数为转化后编码

decode(): 将其他编码转化为unicod极彩娱乐在线平台-关于python编码,你究竟了解多少?快来看看自己的水平e字符串,参数为转化前编码

PS:"string".decode('utf-8') == unicode('string', 'utf-8')

一个栗子

s = '中文'

print type(s), len(s)

u = u'中文'

print type(u), len(u)

u2s = u'中文'.encode('utf-8')

print type(u2s), len(u2s)

结果是这样的

6

2

6

console下检查u2s

>>> u'中文'.encode('utf-8')

'\\xe4\\xb8\\xad\\xe6\\x96\\x87'

定论:

  • python中界说的一个str变量实则是字节串,由Unicode通过编码(encode)后的字节组成的(
  • 也正好印证了utf8编码中一个中文字符是3个字节)
  • Unicode才是真实意义上的字符串,由字符组成

再次回忆两个函数用法

s = '中文'

# 这时是str,转为unicode需求用decode

u = s.decode('utf-8')

print type(u)

# 打印

# unicode转为str ,运用encode

s2 = u.encode('utf-8')

print type(s2)

# 打印

新定论:不同编码转化,运用Unicode作为中心编码

#s是code_A的str

s.decode('code_A').encode小学生作文('code_B')

在Python 3.x版别中,把'xxx'和u'xxx'现已都一致成Unicode编码了,即写不写前缀u都是相同的,而以字节方法表明的字符串则有必要加上b前缀:b'xxx'。

因为Python源代码也是一个极彩娱乐在线平台-关于python编码,你究竟了解多少?快来看看自己的水平文本文件,所以,当你的源代码中包括中文的时分,在保存源代码时,就需求必须指定保存为UTF-8编码。当Python解说器读取源代码时,为了让它按UTF-8编码读取,咱们一般在文件最初写上这两行:

#!/usr/bin/env python

# -*- coding: utf-8 -*-

下面今日共享一些学习python电子书,是不是现已等不及了呢?接下来直接推出下载

Python编程:从入门到实践

从入门到实践

流通的Python

流通的Python

榜首本是「入门必读」,那么第二本就是「进阶必读」,强烈引荐有经历的Python程序员。

Python开发许多入门书本引荐简略的文本编辑器比方sublime,以此来下降初学者的学习门槛。这种方法一开始是方便了,可是我却觉得不是最高效的。ps: 我自己运用过2年的sublime,终究仍是弃用了。

所以我主张初学者直接运用Pycharm来进行编码,假如有必定经历了最好是用Pycharm+Vim的方法,既运用了集成开发环境的各种便当(主动补全,Git版别办理,单元测试等等)方便,又能够把Vim的高效方便键发挥到极致。

书本获取方法: 大家帮转发重视并私信小编关键词:“书本”即可获取以上两本学习书本电子版

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP