Python - Unicode System

What is Unicode System?

Các ứng dụng phần mềm thường yêu cầu hiển thị thông điệp đầu ra bằng nhiều ngôn ngữ khác nhau như tiếng Anh, tiếng Pháp, tiếng Nhật, tiếng Hebrew hoặc tiếng Hindi. Python's string loại này sử dụng Tiêu chuẩn Unicode để đại diện cho các ký tự. Điều này giúp chương trình có thể làm việc với tất cả các ký tự khác nhau này.

Một ký tự là thành phần nhỏ nhất có thể của một văn bản. 'A', 'B', 'C', v.v., đều là những ký tự khác nhau. Cũng như 'È' và 'Í'. Một chuỗi unicode là một chuỗi các điểm mã, là các số từ 0 đến 0x10FFFF (1.114.111 thập phân). Chuỗi các điểm mã này cần được biểu diễn trong bộ nhớ dưới dạng một tập hợp các đơn vị mã, và các đơn vị mã sau đó được ánh xạ thành các byte 8-bit.

Character Encoding

Một chuỗi các điểm mã được biểu diễn trong bộ nhớ dưới dạng một tập hợp các đơn vị mã, được ánh xạ đến các byte 8-bit. Các quy tắc để chuyển đổi một chuỗi Unicode thành một chuỗi byte được gọi là mã hóa ký tự.

Ba loại mã hóa có mặt là UTF-8, UTF-16 và UTF-32. UTF đại diện cho Unicode Transformation Format .

Python's Unicode Support

Python 3.0 trở đi hỗ trợ tích hợp cho Unicode. Kiểu str chứa các ký tự Unicode, do đó bất kỳ chuỗi nào được tạo ra bằng cách sử dụng cú pháp chuỗi đơn, chuỗi kép hoặc chuỗi ba dấu nháy đều được lưu trữ dưới dạng Unicode. Mã hóa mặc định cho mã nguồn Python là UTF-8.

Do đó, chuỗi có thể chứa biểu diễn văn bản của một ký tự Unicode (3/4) hoặc giá trị Unicode của nó (\u00BE).

Example

var = "3/4"
print (var)
var = "\u00BE"
print (var)

Mã code trên sẽ tạo ra output −

3/4
¾

Example

Trong ví dụ sau, một chuỗi '10' được lưu trữ bằng các giá trị Unicode của 1 và 0, đó là \u0031 và \u0030 tương ứng.

var = "\u0031\u0030"
print (var)

Nó sẽ tạo ra output −

Chuỗi (Strings) hiển thị văn bản theo định dạng dễ đọc cho con người, trong khi bytes lưu trữ các ký tự dưới dạng dữ liệu nhị phân. Mã hóa (Encoding) chuyển đổi dữ liệu từ chuỗi ký tự thành một chuỗi byte. Giải mã (Decoding) dịch các byte trở lại thành các ký tự và ký hiệu dễ đọc cho con người. Điều quan trọng là không...

để nhầm lẫn hai phương thức này. encode là một phương thức chuỗi, trong khi decode là một phương thức của đối tượng byte trong Python.

Example

Trong ví dụ sau, chúng ta có một biến chuỗi bao gồm các ký tự ASCII. ASCII là một tập con của bộ ký tự Unicode. Phương thức encode() được sử dụng để chuyển đổi nó thành một đối tượng bytes.

string = "Hello"
tobytes = string.encode('utf-8')
print (tobytes)
string = tobytes.decode('utf-8')
print (string)

Phương thức decode() chuyển đổi đối tượng byte trở lại thành đối tượng str. Phương thức mã hóa được sử dụng là utf-8.

b'Hello'
Hello

Example

Trong ví dụ sau, ký hiệu Rupee (₹) được lưu trữ trong variable bằng giá trị Unicode của nó. Chúng ta chuyển đổi chuỗi thành bytes và sau đó quay lại thành str.

string = "\u20B9"
print (string)
tobytes = string.encode('utf-8')
print (tobytes)
string = tobytes.decode('utf-8')
print (string)

Khi bạn thực thi đoạn mã trên, nó sẽ tạo ra output −

₹
b'\xe2\x82\xb9'
₹

Python - Unicode System

What is Unicode System?

Character Encoding

Python's Unicode Support

Example

Example

Example

Example

» Tin mới nhất

1. Python Tutorial

2. Python - Overview

3. Python - History

4. Python - Features

5. Python vs C++

6. Python - Hello World Program

7. Python - Application Areas

8. Python - Interpreter

9. Python - Environment Setup

10. Python - Virtual Environment

11. Python - Basic Syntax

12. Python - Variables

13. Python - Data Types

14. Python - Type Casting

15. Python - Unicode System

16. Python - Literals

17. Python - Operators

18. Python - Arithmetic Operators

19. Python - Comparison Operators

20. Python - Assignment Operators

21. Python - Logical Operators

22. Python - Bitwise Operators

23. Python - Membership Operators

24. Python - Identity Operators

25. Python - Operator Precedence

26. Python - Comments

27. Python - User Input

28. Python - Numbers

29. Python - Booleans

30. Python - Control Flow

31. Python - Decision Making

32. Python - If Statement

33. Python - If else

34. Python - Nested If

35. Python - Match-Case Statement

36. Python - Loops

37. Python - for Loops

38. Python - for-else Loops

39. Python - While Loops

40. Python - break Statement

41. Python - continue Statement

42. Python - pass Statement

43. Python - Nested Loops

44. Python - Functions

45. Python - Default Arguments

46. Python - Keyword Arguments

47. Python - Keyword-Only Arguments

48. Python - Positional Arguments

49. Python - Positional-Only Arguments

50. Python - Arbitrary Arguments

51. Python - Variables Scope

52. Python - Function Annotations

53. Python - Modules

54. Python - Built in Functions

55. Python - Strings

56. Python - Slicing Strings

57. Python - Modify Strings

58. Python - String Concatenation

59. Python - String Formatting

60. Python - Escape Characters

61. Python - String Methods

62. Python - String Exercises

63. Python - Lists

64. Python - Access List Items

65. Python - Change List Items

66. Python - Add List Items

67. Python - Remove List Items

68. list

69. Python - List Comprehension

70. Python - Sort Lists

71. Python - Copy Lists