У меня есть d1 и d2, и я хочу объединить их по столбцу ID. Однако ID и ID2 точно не совпадают. Вместо этого ID — это первые 8 цифр ID2 (иногда это могут быть первые 6 цифр, а иногда они могут отличаться на одну или две цифры).
Я понимаю, что я могу предварительно обработать ID2, чтобы сохранить только первые 8 цифр. Однако я не могу справиться со всеми ситуациями.
Интересно, есть ли расширенный способ слияния через регулярное выражение для нечеткого совпадения? скажем, если первые 6 цифр совпали, то объединить?
d1=pd.DataFrame({'ID':['00846U10','01381710'],
'count':[100,200]})
d2=pd.DataFrame({'ID2':['00846U101','013817101','02376R102'],
'value':[1,5,6]})
ID
, так иID2
, чтобы они содержали 6 цифр, и, если есть совпадение, затем объединить два кадра данных? - person Nickil Maveli   schedule 03.08.2016