Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

PDF-fayldagi elektron jadvaldan Microsoft Excel varag'iga ma'lumotlarni o'tkazish vazifasi har doim "qiziqarli". Ayniqsa sizda FineReader yoki shunga o'xshash qimmat tanib olish dasturi bo'lmasa. To'g'ridan-to'g'ri nusxa ko'chirish odatda yaxshi narsaga olib kelmaydi, chunki. nusxa ko'chirilgan ma'lumotlarni varaqqa qo'ygandan so'ng, ular katta ehtimollik bilan bitta ustunga "bir-biriga yopishadi". Shunday qilib, ular keyinchalik asbob yordamida mashaqqatli tarzda ajratilishi kerak bo'ladi Ustunlar bo'yicha matn tabdan ma'lumotlar (Ma'lumotlar - matndan ustunlarga).

Va, albatta, nusxa ko'chirish faqat matn qatlami mavjud bo'lgan PDF-fayllar uchun mumkin, ya'ni endigina qog'ozdan PDF-ga skanerlangan hujjat bilan, bu printsipial jihatdan ishlamaydi.

Lekin bu unchalik achinarli emas, haqiqatan ham 🙂

Agar sizda Office 2013 yoki 2016 bo'lsa, unda bir necha daqiqada qo'shimcha dasturlarsiz ma'lumotlarni PDF-dan Microsoft Excel-ga o'tkazish juda mumkin. Bunda bizga Word va Power Query yordam beradi.

Misol uchun, Yevropa Iqtisodiy Komissiyasi veb-saytidagi matn, formulalar va jadvallar to'plami bilan ushbu PDF hisobotini olaylik:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

... va uni Excelda olib tashlashga harakat qiling, birinchi jadvalni ayting:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Qani ketdik!

Qadam 1. Word dasturida PDF-ni oching

Negadir kam odam biladi, lekin 2013 yildan beri Microsoft Word PDF-fayllarni ochish va tanib olishni o'rgandi (hatto skanerlanganlar, ya'ni matn qatlamisiz!). Bu butunlay standart tarzda amalga oshiriladi: Word-ni oching, bosing Fayl - Ochish (Fayl — Ochiq) va oynaning pastki o'ng burchagidagi ochiladigan ro'yxatda PDF formatini belgilang.

Keyin bizga kerak bo'lgan PDF faylni tanlang va bosing ochiq (Ochiq). Word bizga ushbu hujjatda matnga OCR ishga tushirilishini aytadi:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Biz rozi bo'lamiz va bir necha soniyadan so'ng biz PDF-ni Word-da tahrirlash uchun ochiqligini ko'ramiz:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Albatta, dizayn, uslublar, shriftlar, sarlavhalar va altbilgilar va boshqalar qisman hujjatdan uchib ketadi, ammo bu biz uchun muhim emas - bizga faqat jadvallardan ma'lumotlar kerak. Aslida, ushbu bosqichda jadvalni tan olingan hujjatdan Word-ga nusxalash va uni Excel-ga joylashtirish allaqachon jozibali. Ba'zan u ishlaydi, lekin ko'pincha bu ma'lumotlarning har xil buzilishlariga olib keladi - masalan, raqamlar sanaga aylanishi yoki matn bo'lib qolishi mumkin, chunki bizning holatlarimizda. PDF ajratilmaydigan qismlardan foydalanadi:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Shunday qilib, burchaklarni kesib o'tmaylik, lekin hamma narsani biroz murakkabroq qiling, lekin to'g'ri.

2-qadam: Hujjatni veb-sahifa sifatida saqlang

Qabul qilingan ma'lumotlarni Excelga (Power Query orqali) yuklash uchun Word-dagi hujjatimiz veb-sahifa formatida saqlanishi kerak - bu format, bu holda, Word va Excel o'rtasidagi umumiy maxrajning bir turidir.

Buning uchun menyuga o'ting Fayl - Boshqacha saqlash (Fayl — Boshqacha saqlash) yoki tugmani bosing F12 klaviaturada va ochilgan oynada fayl turini tanlang Bir faylda veb-sahifa (Veb-sahifa - bitta fayl):

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Saqlaganingizdan so'ng siz mhtml kengaytmali faylni olishingiz kerak (agar siz Explorer-da fayl kengaytmalarini ko'rsangiz).

3-bosqich. Power Query orqali faylni Excelga yuklash

Siz yaratilgan MHTML faylini to'g'ridan-to'g'ri Excel-da ochishingiz mumkin, ammo keyin biz bir vaqtning o'zida PDF-ning barcha tarkibini matn va bir nechta keraksiz jadvallar bilan birga olamiz, ikkinchidan, biz noto'g'ri ma'lumotlar tufayli yana ma'lumotlarni yo'qotamiz. ajratgichlar. Shuning uchun biz Power Query plaginini Excelga import qilamiz. Bu mutlaqo bepul qo'shimcha bo'lib, uning yordamida Excelga deyarli har qanday manbadan (fayllar, papkalar, ma'lumotlar bazalari, ERP tizimlari) ma'lumotlarni yuklashingiz va keyin olingan ma'lumotlarni har tomonlama o'zgartirishingiz va kerakli shaklni berishingiz mumkin.

Agar sizda Excel 2010-2013 bo'lsa, unda siz Power Query-ni rasmiy Microsoft veb-saytidan yuklab olishingiz mumkin - o'rnatishdan so'ng siz yorliqni ko'rasiz Quvvat so'rovi. Agar sizda Excel 2016 yoki undan yangiroq versiyasi bo'lsa, unda hech narsa yuklab olishingiz shart emas - barcha funksiyalar sukut bo'yicha Excelga o'rnatilgan va yorliqda joylashgan. ma'lumotlar (Sana) guruhda Yuklab oling va aylantiring (Olish va aylantirish).

Shunday qilib, biz yorliqlarga o'tamiz ma'lumotlar, yoki yorliqda Quvvat so'rovi va jamoani tanlang Ma'lumot olish uchun or So'rov yaratish - Fayldan - XML ​​dan. Faqat XML fayllarini emas, balki ko'rinadigan qilish uchun oynaning pastki o'ng burchagidagi ochiladigan ro'yxatdagi filtrlarni o'zgartiring. Barcha fayllar (Barcha fayllar) va MHTML faylimizni belgilang:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

E'tibor bering, import muvaffaqiyatli yakunlanmaydi, chunki. Power Query bizdan XML ni kutadi, lekin bizda HTML formati bor. Shuning uchun, paydo bo'lgan keyingi oynada Power Query uchun tushunarsiz faylni sichqonchaning o'ng tugmasi bilan bosishingiz va uning formatini belgilashingiz kerak bo'ladi:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Shundan so'ng, fayl to'g'ri tan olinadi va biz uning tarkibidagi barcha jadvallar ro'yxatini ko'ramiz:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Ma’lumotlar ustunidagi kataklarning oq fonida (Jadval so‘zida emas!) sichqonchaning chap tugmasini bosish orqali jadvallar mazmunini ko‘rishingiz mumkin.

Kerakli jadval aniqlanganda, yashil so'zni bosing stol - va siz uning mazmuniga "tushib qolasiz":

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

Uning tarkibini "tarash" uchun bir necha oddiy qadamlarni bajarish qoladi, xususan:

  1. keraksiz ustunlarni o'chirish (ustun sarlavhasini sichqonchaning o'ng tugmasi bilan bosing - O'chiring)
  2. nuqtalarni vergul bilan almashtiring (ustunlarni tanlang, o'ng tugmasini bosing - Qiymatlarni almashtirish)
  3. sarlavhadagi teng belgilarni olib tashlang (ustunlarni tanlang, sichqonchaning o'ng tugmachasini bosing - Qiymatlarni almashtirish)
  4. yuqori chiziqni olib tashlang (Bosh sahifa – Chiziqlarni o‘chirish – Yuqori satrlarni o‘chirish)
  5. bo'sh qatorlarni olib tashlang (Uyga - satrlarni o'chirish - bo'sh satrlarni o'chirish)
  6. birinchi qatorni jadval sarlavhasiga ko'taring (Bosh sahifa - sarlavha sifatida birinchi qatordan foydalaning)
  7. filtr yordamida keraksiz ma'lumotlarni filtrlang

Jadval normal holatga keltirilgach, buyruq yordamida uni varaqga tushirish mumkin yoping va yuklab oling (Yopish va yuklash) on Asosiy tab. Va biz allaqachon ishlashimiz mumkin bo'lgan go'zallikka ega bo'lamiz:

Power Query orqali PDF-dan Excel-ga ma'lumotlarni import qiling

  • Power Query yordamida ustunni jadvalga aylantirish
  • Yopishqoq matnni ustunlarga bo'lish

Leave a Reply