tunm二進制協議在python上的實現

tunm二進制協議在python上的實現

tunm是一種對標JSON的二進制協議, 支持JSON的所有類型的動態組合

創新互聯公司自2013年創立以來,先為慶安等服務建站,慶安等地企業,進行企業商務咨詢服務。為慶安企業網站制作PC+手機+微官網三網同步一站式服務解決您的所有建站問題。

支持的數據類型

基本支持的類型 "u8", "i8", "u16", "i16", "u32", "i32", "u64", "i64", "varint", "float", "string", "raw", "array", "map"

為什么我們需要二進制協議

下圖是文本格式JSON與tunm的對比

類型 可讀 可編輯 編碼速度 解碼速度 數據大小 預定義
JSON ? ?
tunm x x
protobuf x x

在高性能的場景下, 或者需要流量傳輸比較敏感的地方, 通常會選擇二進制來代替文本協議來做為通訊的, 如RPC, REST, 游戲等情況。
相對于google protobuf, 它需要比較完善的預定義過程, 就比如客戶端版本1, 服務端版本2, 就有比較大的可能造成不兼容, 對需求經常變化的就會比較難與同步。
tunm相對于JSON, 若第一版是

{
    "name": "tunm", "version": 1
}

此時第二版需要加入用戶的id, 就可以很方便的變成

{
    "name": "tunm", "version": 2, "id": 1
}

而對客戶端1來說, 只是多一個id的字段, 不會有任何的破壞, 做到版本升級而無影響

協議的二進制格式

數據協議分為三部分(協議名稱, 字符串索引區, 數據區(默認為數組))
如數據協議名為cmd_test_op, 數據為["tunm_proto", {"name": "tunm_proto", "tunm_proto": 1}]

  1. 那么數據將先壓縮協議名cmd_test_op, 將先寫下可變長度(varint)值為11占用1字節, 然后再寫入cmd_test_op的utf8的字節數
  2. 接下來準備寫入字符串索引區, 索引數據用到的字符串為["tunm_proto", "name"]兩個字符串, 即將寫入可變長度(varint)值為2占用一字節, 然后分別寫入字符串tunm_proto和name兩個字符串, 這樣子字符串相接近有利于壓縮, 且如果有相同的字符串可以更好的進行復用
  3. 接下來準備寫入數據區,
    首先判斷為一個數組, 寫入類型u8(TYPE_ARR=16), 寫入數組長度varint(2), 準備開始寫第一個數據, 字符串tunm_proto, 已轉成id, 則寫入類型u8(TYPE_STR_IDX=14), 查索引號0, 則寫入varint(0), 第一個字段寫入完畢, 接下來第二個字段是一個map數據, 寫入map長度varint(2), 然后進行遍歷得到key值為name, 則寫入寫入類型u8(TYPE_STR_IDX=14),查索引號1, 則寫入varint(1), 然后開始寫name對應的值tunm_proto, 寫入TYPE_STR_IDX類型的0值, 則這組key寫入完畢, 依此類推寫入第二組數據

協議的實現(小端對齊)

ByteBuffer的實現

ByteBuffer具有組裝字節流的功能, 比如寫入字符串, 寫入int, 還有里面存儲字符串索引區

class ByteBuffer(object):
    def __init__(self):
        # 字節緩沖區
        self.buffer = bytearray([00]*1024)
        # 寫入的位置索引號
        self.wpos = 0
        # 讀出的位置索引號
        self.rpos = 0
        # 大小端格式
        self.endianness = "little"
        # 索引的數組及快速查詢的字符串索引號
        self.str_arr = []
        self.str_map = {}

ByteBuffer源碼地址

類型的定義

@enum.unique
class TP_DATA_TYPE(IntEnum):
    TYPE_NIL = 0,
    TYPE_BOOL = 1,
    TYPE_U8 = 2,
    TYPE_I8 = 3,
    TYPE_U16 = 4,
    TYPE_I16 = 5,
    TYPE_U32 = 6,
    TYPE_I32 = 7,
    TYPE_U64 = 8,
    TYPE_I64 = 9,
    TYPE_VARINT = 10,
    TYPE_FLOAT = 11,
    TYPE_DOUBLE = 12,
    TYPE_STR = 13,
    TYPE_STR_IDX = 14,
    TYPE_RAW = 15,
    TYPE_ARR = 16,
    TYPE_MAP = 17,

數據的組裝

變長的int類型, 用來寫入string長度, 數組長度, map長度, 部分數值類型
@staticmethod
def encode_varint(buffer: ByteBuffer, value):
    '''
    如果原數值是正數則將原數值變成value*2
    如果原數值是負數則將原數值變成-(value + 1) * 2 + 1
    相當于0->0, -1->1, 1->2,-2->3,2->4來做處理
    因為小數值是常用的, 所以保證小數值及負數的小數值盡可能的占少位
    '''
    if type(value) == bool:
        value = 1 if value else 0
    real = value * 2
    if value < 0:
        real = -(value + 1) * 2 + 1
    
    for _i in range(12):
        # 每個字節的最高位來表示有沒有下一位, 若最高位為0, 則已完畢
        b = real & 0x7F
        real >>= 7
        if real > 0:
            buffer.write_u8(b | 0x80)
        else:
            buffer.write_u8(b)
            break
寫入字符串, 把字符串變成索引值, 如果協議里有大量重復的字符串可大大的節約協議的長度
@staticmethod
def encode_str_idx(buffer: ByteBuffer, value):
    '''
    寫入字符串索引值, 在數值區里的所有字符串默認會被寫成索引值
    如果重復的字符串則會返回相同的索引值(varint)
    '''
    idx = buffer.add_str(value)
    TPPacker.encode_type(buffer, TP_DATA_TYPE.TYPE_STR_IDX)
    TPPacker.encode_varint(buffer, idx)
寫入各種對應的類型
@staticmethod        
def encode_field(buffer: ByteBuffer, value, pattern=None):
    '''
    先寫入類型的值(u8), 則根據類型寫入類型對應的的數據
    '''
    if not pattern:
        pattern = TPPacker.get_type_by_ref(value)
    if pattern == TP_DATA_TYPE.TYPE_NIL:
        return None
    elif pattern == TP_DATA_TYPE.TYPE_BOOL:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_bool(buffer, value)
    elif pattern >= TP_DATA_TYPE.TYPE_U8 and pattern <= TP_DATA_TYPE.TYPE_I8:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_number(buffer, value, pattern)
    elif pattern >= TP_DATA_TYPE.TYPE_U16 and pattern <= TP_DATA_TYPE.TYPE_I64:
        TPPacker.encode_type(buffer, TP_DATA_TYPE.TYPE_VARINT)
        TPPacker.encode_varint(buffer, value)
    elif pattern == TP_DATA_TYPE.TYPE_FLOAT:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_number(buffer, value, pattern)
    elif pattern == TP_DATA_TYPE.TYPE_DOUBLE:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_number(buffer, value, pattern)
    elif pattern == TP_DATA_TYPE.TYPE_STR:
        TPPacker.encode_str_idx(buffer, value)
    elif pattern == TP_DATA_TYPE.TYPE_RAW:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_str_raw(buffer, value)
    elif pattern == TP_DATA_TYPE.TYPE_ARR:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_arr(buffer, value)
    elif pattern == TP_DATA_TYPE.TYPE_MAP:
        TPPacker.encode_type(buffer, pattern)
        TPPacker.encode_map(buffer, value)
    else:
        raise Exception("unknow type")
        
@staticmethod
def encode_arr(buffer: ByteBuffer, value):
    '''
    寫入數組的長度, 再寫入各各元素的值
    '''
    TPPacker.encode_varint(buffer, len(value))
    for v in value:
        TPPacker.encode_field(buffer, v)
        
@staticmethod
def encode_map(buffer: ByteBuffer, value):
    '''
    寫入map的長度, 再分別寫入map各元素的key, value值
    '''
    TPPacker.encode_varint(buffer, len(value))
    for k in value:
        TPPacker.encode_field(buffer, k)
        TPPacker.encode_field(buffer, value[k])
寫入一條協議
@staticmethod
def encode_proto(buffer: ByteBuffer, name, infos):
    '''
    寫入協議名稱, 然后寫入字符串索引區(即字符串數組), 然后再寫入協議的詳細數據
    '''
    sub_buffer = ByteBuffer()
    TPPacker.encode_field(sub_buffer, infos)

    TPPacker.encode_str_raw(buffer, name, TP_DATA_TYPE.TYPE_STR)
    TPPacker.encode_varint(buffer, len(sub_buffer.str_arr))
    for val in sub_buffer.str_arr:
        TPPacker.encode_str_raw(buffer, val, TP_DATA_TYPE.TYPE_STR)

    buffer.write_bytes(sub_buffer.all_bytes())
解碼與編碼的過程相反, 類似的過程

tunm源碼地址

相關連接

協議地址https://github.com/tickbh/TunmProto

新聞標題:tunm二進制協議在python上的實現
URL鏈接:http://m.kartarina.com/article0/dsogjoo.html

成都網站建設公司_創新互聯,為您提供標簽優化、域名注冊、做網站靜態網站、移動網站建設、

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都網站建設
主站蜘蛛池模板: 国产亚洲精品无码成人 | av无码久久久久不卡免费网站| 久久久久久亚洲精品无码| 无码人妻精品一区二区蜜桃| 无码精品人妻一区二区三区影院| 亚洲av中文无码乱人伦在线咪咕| 少妇人妻无码精品视频| 无码人妻精品一区二区三区9厂| 亚洲精品无码永久中文字幕| 人妻少妇看A偷人无码精品视频 | 永久免费av无码网站yy| 69ZXX少妇内射无码| 中文无码人妻有码人妻中文字幕| 精品爆乳一区二区三区无码av| 亚洲欧洲无码AV电影在线观看| 亚洲精品无码少妇30P| 亚洲AV永久无码精品水牛影视| 日韩精品无码久久一区二区三| 91久久精品无码一区二区毛片| 国产成人综合日韩精品无码不卡| 免费无码AV片在线观看软件| 人妻丰满熟妇AV无码片| 成人午夜亚洲精品无码网站 | 久久久无码人妻精品无码| 东京热无码av一区二区| 免费看国产成年无码AV片| 亚洲最大天堂无码精品区| 无码精品A∨在线观看| 无码AV岛国片在线播放| 久久精品aⅴ无码中文字字幕| 国产日韩AV免费无码一区二区| 国产网红主播无码精品| 国产综合无码一区二区色蜜蜜| 日韩免费a级毛片无码a∨| 中文字幕久久久人妻无码| 99精品国产在热久久无码| 精品无码久久久久国产| 最新无码专区视频在线| 精品久久久无码人妻中文字幕豆芽| 精品无码专区亚洲| 曰韩无码AV片免费播放不卡|