ცოდნის ბაზები
შექმენით თქვენი ასისტენტის ცოდნის საფუძველი:
JSON ფორმატში ტრენინგ მონაცემების ატვირთვით, ან
გასაღები-მნიშვნელობა(key/value) წყვილების ხელით დამატებით
ვექტორული მონაცემთა ბაზა და RAG

რა არის ვექტორული მონაცემთა ბაზა?
ეს არის სპეციალური ტიპის მონაცემთა ბაზა, რომელიც ინახავს ინფორმაციას რიცხვების სიების (ვექტორების) სახით. თითოეული ობიექტი - იქნება ეს სიტყვა, სურათი, ტექსტი თუ სხვა - გარდაიქმნება რიცხვების მასივად.
ჩვენს მაგალითში ზედა სურათზე გვაქვს 300 განზომილება, რაც ნიშნავს, რომ თითოეული ობიექტი წარმოდგენილია 300 რიცხვით:
[0.34, 2.35, 8.34, ...] - ეს არის ვექტორი 300 რიცხვით
სემანტიკური(აზრობრივი,მნიშვნელობითი) სიახლოვე
ეს არის ბაზაში არსებული ობიექტების მნიშვნელობითი და აზრობრივი სიახლოვე ერთმანეთთან
მარცხენა მხარე (მსგავსი ობიექტები):
მგელი, ძაღლი, კატა - ერთმანეთის მახლობლად არის რადგან ყველა ცხოველია.
ქათამი - ცალკე მდგომია თუმცა შორიახლოს არის რადგან არსებოს მნიშვნელობითი კავშირი ცხოველსა და ფრინველეს შორის.
კნუტი - ის ყველაზე ახლოსაა კატასთან მნიშვნელობით, და ამიტომ სიტყვა კნუტთან დაკავშირებული კითხვა რომ დაისვას ბაზაში მოხდება ამ მცნებასთან დაკავშირებული ყველა ცხოველის, სახელის თუ სხვა მნიშვნელობითი მატარებელი სიტყვებისა და წინადადების დაძებნა და შემდგომ საუკეთესო პასუხის დაბრუნება.
მარჯვენა მხარე (ტექნოლოგიური კომპანიები):
🍌 ბანანი
🍎 ვაშლი - Apple კომპანია
G - Google
ვაშლი - კიდევ Apple-ის მსგავსი
როგორ მუშაობს?
ემბედინგი: AI მოდელი გარდაქმნის სიტყვებს/სურათებს რიცხვებად
სივრცეში განთავსება: მსგავსი მნიშვნელობის ობიექტების განთავსება ხდება ერთმანეთთან ახლოს.
ძიება: როცა ეძებთ რამეს, სისტემა პოულობს უახლოეს ვექტორებს
რა არის RAG?
RAG ( გამდიდრებული მოძიებით გენერაცია) - არის ტექნიკა, რომელიც აერთიანებს ძიებას და AI გენერაციას. ეს არის გზა, რომ AI-მ უპასუხოს კითხვებს თქვენი კონკრეტული ცოდნის ბაზის საფუძველზე.
RAG-ის 3 ძირითადი ნაბიჯი:
1️⃣ Retrieval (მოძიება)
მომხმარებელი სვამს კითხვას
სისტემა გარდაქმნის კითხვას ვექტორად
ვექტორულ მონაცემთა ბაზაში ეძებს ყველაზე რელევანტურ ინფორმაციას
პოულობს 3-5 ყველაზე მსგავს დოკუმენტს/ფრაგმენტს
2️⃣ Augmentation (გამდიდრება)
აღებული დოკუმენტები ემატება კითხვას როგორც კონტექსტი
AI-ს ეძლევა როგორც თქვენი კითხვა, ასევე რელევანტური ინფორმაცია
3️⃣ Generation (გენერაცია)
AI მოდელი აანალიზებს კონტექსტს
აგენერირებს პასუხს კონკრეტული დოკუმენტების საფუძველზე
პასუხი არის ზუსტი და დასაბუთებული
პრაქტიკული მაგალითი:
ტრადიციული AI:
კითხვა: "რა არის ჩვენი კომპანიის შვებულების პოლიტიკა?"
პასუხი: "მე არ ვიცი თქვენი კონკრეტული კომპანიის პოლიტიკა..."
RAG-ით:
კითხვა: "რა არის ჩვენი კომპანიის შვებულების პოლიტიკა?"
მოძიება: სისტემა პოულობს კომპანიის HR დოკუმენტებში შვებულების შესახებ ნაწილებს
აუგმენტაცია(გამდიდრება): ემატება ეს ინფორმაცია AI-ს
გენერაცია: "თქვენი კომპანიის პოლიტიკის მიხედვით, თანამშრომლებს აქვთ 20 დღიანი ანაზღაურებადი შვებულება წელიწადში, დამატებით 10 დღე სამედიცინო შვებულება..."
კითხვა → [ვექტორიზაცია] → ვექტორული ძიება → რელევანტური დოკუმენტები
↓
AI მოდელი ← [კონტექსტი] ←
↓
პასუხიგამოყენების სფეროები:
📚 დოკუმენტაცია - კომპანიის შიდა ცოდნის ბაზა 🏥 ჯანდაცვა - სამედიცინო ჩანაწერების ანალიზი ⚖️ იურიდიული - სამართლებრივი დოკუმენტების ძიება 🛍️ ელ-კომერცია - პროდუქტების ინტელექტუალური რეკომენდაცია 📞 მომხმარებელთა სერვისი - ავტომატური მხარდაჭერა
Last updated