Question 1

Ile czasu zajmuje ładowanie 10 dokumentów PDF do lokalnej bazy RAG?

Accepted Answer

W trybie równoległym (parallel) na Lenovo ThinkStation PGX z układem Grace Blackwell ładowanie 10 plików PDF (~100 KB każdy) zajęła łącznie 89,2 sekundy (wall-clock). Na Intel NUC7i5DNHE (i5-7300U, 16 GB) ten sam zestaw w trybie parallel zajął 317 sekund. Wyniki dotyczą serwisu RAG opartego na CerebrOS/LegalOS działającego lokalnie, bez wysyłania danych do chmury.

Question 2

Czym różni się tryb sequential od parallel przy ładowaniu RAG?

Accepted Answer

W trybie sequential dokumenty są przesyłane i przetwarzane jeden po drugim. W trybie parallel wszystkie pliki są wysyłane do serwisu jednocześnie (współbieżne żądania HTTP POST), a serwer przetwarza je równolegle. Na ThinkStation PGX parallel jest 1,68× szybszy od sequential (89,2 s vs 150 s), na NUC 1,63× szybszy (317 s vs 518 s).

Question 3

Jak szybki jest ThinkStation PGX przy lokalnym ładowaniu dokumentów do RAG?

Accepted Answer

Lenovo ThinkStation PGX z modułem GB10 (20-core ARM, Grace Blackwell, 128 GB unified memory) osiągnął średni czas przetwarzania dokumentu 17,4 s w trybie parallel i 10,3 s w trybie sequential. Łączny wall-clock dla 10 dokumentów: 89,2 s (parallel) i 150 s (sequential). To 3,55× szybciej niż Intel NUC7i5DNHE w trybie parallel.

Question 4

Czy równoległe ładowanie jest zawsze szybsze od sequential w systemach RAG?

Accepted Answer

Pod względem wall-clock (całkowity czas od startu do końca) parallel jest szybszy, bo eliminuje oczekiwanie między plikami. Jednak średni czas na plik w parallel jest wyższy niż w sequential, bo serwer obsługuje konkurujące żądania jednocześnie i dochodzi do kolejkowania CPU. Parallel opłaca się, gdy zależy Ci na czasie całkowitego wsadu.

Question 5

Jak wypada Intel NUC w porównaniu z ThinkStation PGX przy lokalnym AI?

Accepted Answer

Intel NUC7i5DNHE (i5-7300U, 16 GB DDR4) jest 3,45× wolniejszy od ThinkStation PGX w trybie sequential (518 s vs 150 s) i 3,55× wolniejszy w trybie parallel (317 s vs 89,2 s). Głównym wąskim gardłem NUC jest CPU — średni czas przetwarzania po stronie serwera wynosi 119,9 s/plik w parallel wobec 17,4 s na PGX.

Question 6

Co to jest CerebrOS RAG Service i jak działa ładowanie dokumentów?

Accepted Answer

CerebrOS to autorski framework AI Transformation łączący lokalną bazę wiedzy RAG, GUI, CRM i autonomicznych agentów AI. Ładowanie dokumentów polega na wysłaniu pliku PDF przez HTTP POST do lokalnego serwisu RAG, który parsuje tekst, dzieli go na chunki, generuje embeddingi lokalnym modelem i zapisuje wektory w bazie. Cały proces odbywa się lokalnie — dane nigdy nie opuszczają infrastruktury klienta.

Question 7

Jakie formaty plików obsługuje RAG Worker w CerebrOS?

Accepted Answer

RAG Worker w CerebrOS obsługuje ładowanie dokumentów w wielu formatach: PDF, DOCX, TXT, MD (Markdown), obrazy (JPG, PNG — z ekstrakcją tekstu przez OCR) oraz nagrania audio (transkrypcja przed indeksowaniem). Każdy plik jest automatycznie parsowany, dzielony na chunki i indeksowany w lokalnej bazie wektorowej. Dzięki temu firma może ładować do bazy wiedzy zarówno umowy i regulaminy (PDF/DOCX), notatki tekstowe (TXT/MD), jak i skany dokumentów czy nagrania ze spotkań.

Question 8

Jaki sprzęt wybrać do lokalnej bazy wiedzy RAG w firmie?

Accepted Answer

Benchmark pokazuje, że CPU-only (Intel NUC, i5) jest niewystarczające dla produkcyjnego RAG przy większych wolumenach dokumentów — czas przetwarzania jest ~7× wyższy niż na sprzęcie z dedykowanym akceleratorem. Dla kancelarii prawnych i firm obsługujących dziesiątki dokumentów dziennie rekomendujemy sprzęt klasy NVIDIA DGX Spark lub ThinkStation PGX z unified memory ≥ 64 GB, zapewniający ładowanie poniżej 2 minut dla 10 dokumentów w trybie parallel.

Question 9

Czy wyniki benchmarku dotyczą konkretnego modelu językowego?

Accepted Answer

Benchmark mierzy czas ładowania (parsowanie PDF, chunking, embeddingi, zapis do wektory DB), nie czas generowania odpowiedzi przez LLM. Testy przeprowadzono na tym samym modelu embeddingów na obu maszynach — różnica wynika wyłącznie z mocy obliczeniowej sprzętu. Wyniki są reprezentatywne dla dokumentów prawnych w języku polskim (~100 KB PDF, ~1 500–2 500 słów).

RAG Ingest Benchmark