通过对文本进行编码来判断原文本是否为乱码,像一些颜文字也会被识别未乱码

def check_is_encode_error(string):
    try:
        string.encode('gbk')
    except UnicodeEncodeError:
        return True
    return False


def main():
    # 正常字符返回False
    a = '北极1a*&&&/、?%F$^_^、'
    r = check_is_encode_error(a)
    print(r)
    # 乱码字符返回True
    b = 'å®¶BBQï'
    r = check_is_encode_error(b)
    print(r)


if __name__ == "__main__":
    main()

感谢原博主的分享:这里

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐