Zamiast klikać, napisałam kod. Historia skryptu, który oszczędził dni pracy.

PrzezKinga Maleszewska 2025-06-162025-08-06

Stajesz przed nowym, ekscytującym projektem. Masz zbudować dla klienta dedykowane narzędzie oparte na solidnej bazie danych. Jest tylko jeden problem: cała wiedza, całe „złoto”, które ma zasilić tę bazę, jest zamknięte w setkach stron plików PDF.

To był dokładnie mój punkt wyjścia. Stanęłam przed wyborem. Mogłam pójść drogą na skróty: otworzyć każdy PDF i ręcznie przekopiować setki pytań i odpowiedzi. Zadanie wykonalne, ale piekielnie żmudne, powolne i proszące się o błąd. Wiedziałam, że to pułapka, zwłaszcza że klient planował w przyszłości dosyłać kolejne pliki.

Wybrałam drugą drogę, którą uwielbiam. Zamiast spędzać godziny na klikaniu, postanowiłam zainwestować ten czas w napisanie prostego, ale potężnego narzędzia – konwertera w Pythonie, który wykona całą pracę za mnie.

Gdy diabeł tkwi w formatowaniu

Pierwszy krok – wyciągnięcie surowego tekstu z plików PDF za pomocą biblioteki pdfplumber – poszedł gładko. Prawdziwe wyzwanie zaczęło się później. Okazało się, że każdy PDF, choć pozornie identyczny, miał swoje małe „widzimisię”: a to dodatkowy odstęp, a to inny znak nowej linii. Te drobne anomalie sprawiały, że proste metody oddzielania pytań od odpowiedzi zawodziły. Tekst był chaotyczną mieszanką, która wymagała inteligentnego podejścia.

Moja broń: Wyrażenia regularne (RegEx)

W walce z nieustrukturyzowanym tekstem moją tajną bronią są wyrażenia regularne. To jak dać komputerowi supermoc rozumienia wzorców w tekście. Zamiast mówić mu „szukaj litery A”, mówię mu: „znajdź mi linijkę, która zaczyna się od litery A, po której może być gwiazdka, potem dowolna spacja, a następnie przechwyć wszystko aż do końca linii”.

Dzięki bibliotece re w Pythonie stworzyłam precyzyjne wzorce, które potrafiły „wyłuskać” z chaosu dokładnie te dane, których potrzebowałam. Poniższy fragment kodu to serce mojego automatu – logiką, która analizuje blok tekstu, identyfikuje pytanie i poprawną odpowiedź, a następnie składa je w uporządkowaną strukturę.


# Fragment kodu, który z bloku tekstu wyciąga pytanie i odpowiedź
for i in range(1, len(blocks), 2):
    content = blocks[i + 1].strip()
    
    # Użycie RegEx do znalezienia poprawnej odpowiedzi (zaczynającej się od 'A')
    match = re.search(r'^A\s*(\*?)\s*(.+)', content, re.MULTILINE)
    if match:
        # Wyłuskanie odpowiedzi i reszty tekstu (który jest pytaniem)
        correct_answer = match.group(2).strip()
        question_text = re.split(r'^A\s*(\*?)\s*(.+)', content, maxsplit=1, flags=re.MULTILINE)[0].strip()
        
        # Oczyszczenie i dodanie do finalnej listy
        questions.append({
            "questionText": question_text,
            "correctAnswerText": correct_answer
        })

Na końcu skrypt zapisywał wszystkie dane w czystym, ustrukturyzowanym pliku JSON, gotowym do zasilenia głównej bazy danych.

Efekt? Godziny zamienione w sekundy

Rezultat tej pracy był transformujący. Proces, który ręcznie zająłby mi wiele dni żmudnego kopiowania, skrócił się do kilku minut. Co ważniejsze, stworzyłam skalowalne rozwiązanie. Gdy za miesiąc klient przyśle nową partię plików PDF, aktualizacja bazy danych będzie błyskawiczna i bezbłędna.

Uwielbiam takie projekty, bo pokazują prawdziwą moc kodu. To nie była budowa skomplikowanego systemu, ale stworzenie małego, prostego narzędzia, które rozwiązało jeden, ale za to bardzo uciążliwy problem. Czasem taki inteligentny skrypt przynosi więcej wartości biznesowej niż największe aplikacje, uwalniając nas od nudnych zadań i pozwalając skupić się na kreatywnej pracy.

Czy w Twojej firmie jest proces, w którym ktoś godzinami ręcznie przekleja dane z jednego miejsca w drugie? A może toniesz w dokumentach, z których dane trzeba przenieść do systemu?

Zapraszam na bezpłatną konsultację. Porozmawiajmy o tym, jak mały, sprytny automat mógłby zaoszczędzić Twój czas i pieniądze.

usługi programistyczne

Od działającego prototypu do żywej aplikacji. Historia o architekturze, która oddała projektowi duszę.
PrzezKinga Maleszewska 2025-09-292025-09-26

Późny wieczór. Na ekranie laptopa widać działający prototyp aplikacji mobilnej – owoc miesięcy samodzielnej pracy. Technicznie, rdzeń funkcjonuje: można przeglądać dane, klikać przyciski, zapisywać informacje. Ale mimo to, w powietrzu unosi się uczucie frustracji. Aplikacja, mimo że działała, nie miała „duszy”. Była zbiorem połączonych ze sobą funkcji, a nie spójnym, intuicyjnym doświadczeniem. Przepływy użytkownika były nielogiczne, interfejs toporny, a najlepsze pomysły gubiły się gdzieś…

Dowiedz się więcej Od działającego prototypu do żywej aplikacji. Historia o architekturze, która oddała projektowi duszę.
strony www|usługi programistyczne

Twoja prywatna piaskownica: Jak w 5 krokach sklonować stronę WordPress na lokalny komputer
PrzezKinga Maleszewska 2025-08-252025-08-25

Znasz ten strach? Masz wprowadzić ważną zmianę na działającej stronie klienta. Jedna mała pomyłka, jedna źle zaktualizowana wtyczka i cały serwis, na który patrzą setki lub tysiące użytkowników, może przestać działać. Praca na „żywym organizmie” to ogromny stres i ryzyko. Na szczęście jest na to profesjonalne rozwiązanie: stworzenie idealnej kopii 1:1 strony produkcyjnej na Twoim własnym komputerze. To Twoja prywatna, bezpieczna piaskownica, w której możesz testować, psuć i naprawiać bez żadnych…

Dowiedz się więcej Twoja prywatna piaskownica: Jak w 5 krokach sklonować stronę WordPress na lokalny komputer
usługi programistyczne

Jak oswoić KSeF? Studium przypadku automatu w PHP, który pobiera faktury za Ciebie.
PrzezKinga Maleszewska 2025-08-042025-08-06

Wprowadzenie Krajowego Systemu e-Faktur (KSeF) to jedna z największych cyfrowych rewolucji dla polskich firm. Z jednej strony – krok w przyszłość. Z drugiej – nowe, potężne wyzwanie. Wyobraź sobie konieczność ręcznego pobierania i archiwizowania setek faktur sprzedażowych i zakupowych każdego miesiąca. To proces nie tylko żmudny, ale i obarczony ogromnym ryzykiem błędu, który w księgowości może być kosztowny. Właśnie z takim wyzwaniem zgłosił się do mnie jeden z klientów. Potrzebował niezawodnego sposobu,…

Dowiedz się więcej Jak oswoić KSeF? Studium przypadku automatu w PHP, który pobiera faktury za Ciebie.
strony www|usługi programistyczne

Twoja aplikacja React online w 15 minut? Praktyczny przewodnik po wdrożeniu na Netlify
PrzezKinga Maleszewska 2025-07-142025-08-06

Siedzisz przed ekranem i uśmiechasz się. Twoja nowa aplikacja w React działa idealnie, każdy komponent jest na swoim miejscu, a logika śmiga bez zarzutu… na Twoim komputerze. I wtedy pojawia się to pytanie: „Co dalej?”. Jak w prosty i, co najważniejsze, darmowy sposób pokazać ją światu? Dla wielu osób na początku drogi proces wdrożenia (deploymentu) brzmi jak czarna magia. Kojarzy się ze skomplikowaną konfiguracją serwerów, komendami w terminalu i stresem. Chcę Ci dziś…

Dowiedz się więcej Twoja aplikacja React online w 15 minut? Praktyczny przewodnik po wdrożeniu na Netlify
usługi programistyczne

Ten sam kod, dwa różne światy. Jak adaptacyjny algorytm rozwiązał problem OCR w trybie jasnym i ciemnym.
PrzezKinga Maleszewska 2025-07-072025-08-06

Każdy, kto próbował zmusić komputer do odczytania tekstu ze zdjęcia, wie, że optyczne rozpoznawanie znaków (OCR) to często droga przez mękę. A jeśli to zdjęcie ekranu monitora? Wtedy wkraczamy na zupełnie nowy poziom wyzwań. Do gry wchodzą odblaski światła, denerwujące wzory moiré i ogólna nieostrość wynikająca z fotografowania siatki pikseli. W jednym z moich ostatnich projektów stanęłam przed zadaniem zbudowania w Kotlinie rdzenia aplikacji mobilnej, której kluczową funkcją było właśnie precyzyjne odczytanie…

Dowiedz się więcej Ten sam kod, dwa różne światy. Jak adaptacyjny algorytm rozwiązał problem OCR w trybie jasnym i ciemnym.
strony www|usługi programistyczne

Twoje zmiany znikają po aktualizacji? Poznaj motyw potomny (Child Theme) w WordPressie.
PrzezKinga Maleszewska 2025-06-302025-08-06

Jest taki moment grozy, który zna niemal każdy właściciel strony na WordPressie. Widzisz powiadomienie o dostępnej aktualizacji motywu, wiesz, że powinieneś ją zainstalować ze względów bezpieczeństwa, ale czujesz zimny pot. Klikasz „Aktualizuj”, a po chwili wszystkie Twoje starannie wprowadzone zmiany w wyglądzie i funkcjach… znikają. Bezpowrotnie. To pułapka, w którą wpada wielu. W jednym z poprzednich projektów, aby naprawić mylącą nawigację, dodałam klientce niestandardowy fragment kodu do plików jej motywu. Poprawka działała idealnie,…

Dowiedz się więcej Twoje zmiany znikają po aktualizacji? Poznaj motyw potomny (Child Theme) w WordPressie.

Gdy diabeł tkwi w formatowaniu

Moja broń: Wyrażenia regularne (RegEx)

Efekt? Godziny zamienione w sekundy

Podobne wpisy