образец первой строки файла журнала событий, здесь я успешно извлек все, кроме последней пары значений ключа, которая является атрибутом-
{"event_type":"ActionClicked","event_timestamp":1451583172592,"arrival_timestamp":1451608731845,"event_version":"3.0",
"application":{"app_id":"7ffa58dab3c646cea642e961ff8a8070","cognito_identity_pool_id":"us-east-1:
4d9cf803-0487-44ec-be27-1e160d15df74","package_name":"com.think.vito","sdk":{"name":"aws-sdk-android","version":"2.2.2"}
,"title":"Vito","version_name":"1.0.2.1","version_code":"3"},"client":{"client_id":"438b152e-5b7c-4e99-9216-831fc15b0c07",
"cognito_id":"us-east-1:448efb89-f382-4975-a1a1-dd8a79e1dd0c"},"device":{"locale":{"code":"en_GB","country":"GB",
"language":"en"},"make":"samsung","model":"GT-S5312","platform":{"name":"ANDROID","version":"4.1.2"}},
"session":{"session_id":"c15b0c07-20151231-173052586","start_timestamp":1451583052586},"attributes":{"OfferID":"20186",
"Category":"40000","CustomerID":"304"},"metrics":{}}
Всем привет, я пытаюсь извлечь содержимое из файла журнала событий, как показано на прикрепленном изображении. Что касается требования, я должен получить customer ID
, offer id
, category
, это важные переменные, которые мне нужно извлечь из этого файла журнала событий. это файл в формате csv. я пробовал с регулярным выражением, но оно не работает, потому что вы можете наблюдать, что формат каждого столбца отличается. Как вы видите, первая строка имеет category
customer id
offer id
, а вторая строка полностью пуста, в этом случае регулярное выражение не будет работать, кроме этого, мы должны учитывать, что мы должны учитывать все возможные условия, у нас есть 14000 Sample.in файл журнала событий ... # Джейсон # Разбор #Python #Pandas
{}
? Если это так, похоже, вы можете прочитать файл построчно и использоватьliteral_eval
, чтобы превратить каждую строку в объект Pythondict
. - person DeepSpace   schedule 10.07.2016