File size: 2,288 Bytes
50408e8
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import re
s = 'book 书 ruler 尺子 pencil 铅笔 eraser 橡皮pencil case 铅笔盒 backpack 书包 school 学校eye 眼睛 hand 手 ear 耳朵 mouth 嘴nose 鼻子 foot(feet) 脚 face 脸 leg 腿 arm 手臂cat 猫 bird 鸟 rabbit 兔 dog 狗 chicken 鸡 duck 鸭monkey 猴子 tiger 虎 panda 熊猫 elephant 大象 fish 鱼one 一 two 二 three 三 four 四 five 五 six 六seven 七 eight 八 nine 九 ten 十red 红色 yellow 黄色 purple 紫色 brown 棕色 orange 橙色 white 白色 green 绿色 pink 粉红色 blue 蓝色 black 黑色 apple 苹果 banana 香蕉 peach 桃 melon 瓜pear 梨 orange 橙子 grape 葡萄 strawberry 草莓 pineapple 菠萝 classroom 教室 door 门 window 窗 blackboard 黑板wall 墙 desk 课桌 chair 椅子 boy 男孩 girl 女孩in 在...里面 on 在...上面 under 在...下面behind 在...后面 next to 下一个 where 哪里 room 房间 closet 关门 telephone 电话 computer 电脑TV 电视 bed 床 picture 图片 table 桌子lamp 台灯 armchair 沙发 toys 玩具 plane 飞机 boat 小船 train 火车ball 球 teddy bear 泰迪熊 bus 公交车 car 汽车doll 玩偶 pinwheel 纸风车 box 箱子 Shapes 形状 circle 圆形 triangle 三角形 rectangle 长方形square 正方形 eleven 十一 twelve 十二 Thirteen 十三fourteen 十四 fifteen 十五 sixteen 十六 seventeen 十七eighteen 十八 nineteen 十九 twenty 二十 clothes 衣服 T-shirt 丁恤 pants 长裤 shorts 短裤jacket 夹克 sweater 毛衣 skirt 短裙dress 连衣裙 shoe 鞋 sock 袜子 food 食物 drink 饮料 rice 米 noodles 面条jiaozi 饺子 tofu 豆腐 vegetables 蔬菜 meat 肉fish 鱼 chicken 鸡肉 bread 面包 milk 牛奶ice-cream 冰激凌 juice 果汁 egg 鸡蛋 salad 色拉hamburger 汉堡包 cake 蛋糕 '
# result = "".join(i for i in s if ord(i) < 256)
zh_list = []
en_list = []
# result = re.match('(([a-z]|[A-Z])+\b+([\u4e00-\u9fa5])+)+', s)
zh_list = re.findall('[\u4e00-\u9fa5...]+',s)
en_list = re.findall('(([a-zA-Z\s\(\)\-])+)',s)

# print(zh_list)
# print(en_list)
# print(','.join(["'"+g[0]+"'" for g in en_list]))

result = []
for z,e in zip(zh_list,en_list):
    print(z,e[0])
    result.append(str.strip(e[0]) + ' —— ' + z)


print(len(zh_list))
print(len(en_list))
print(','.join(["'"+str.strip(g)+"'" for g in result]))