Artwork

Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal
Player FM - पॉडकास्ट ऐप
Player FM ऐप के साथ ऑफ़लाइन जाएं!

Vectors & Vector Stores in RAG (Chapter 7)

19:44
 
साझा करें
 

Manage episode 523867881 series 3705596
Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal

Unlock the core infrastructure powering retrieval-augmented generation (RAG) systems in this technical deep dive. We explore how vector embeddings and vector stores work together to enable fast, scalable, and semantically rich retrieval for LLMs, drawing insights directly from Chapter 7 of Keith Bourne’s book.

In this episode:

- Understand the role of high-dimensional vectors and vector stores in powering RAG

- Compare embedding models like OpenAIEmbeddings, BERT, and Doc2Vec

- Explore vector store technologies including Chroma, Milvus, Pinecone, and pgvector

- Deep dive into indexing algorithms like HNSW and adaptive retrieval techniques such as Matryoshka embeddings

- Discuss architectural trade-offs for production-ready RAG systems

- Hear real-world applications and operational challenges from embedding compatibility to scaling

Key tools & technologies mentioned:

OpenAIEmbeddings, BERT, Doc2Vec, Chroma, Milvus, Pinecone, pgvector, LangChain, HNSW, Matryoshka embeddings

Timestamps:

00:00 - Introduction to vectors and vector stores in RAG

02:15 - Why vectors are the backbone of retrieval-augmented generation

05:40 - Embedding models: trade-offs and use cases

09:10 - Vector stores and indexing: Chroma, Milvus, Pinecone, pgvector

13:00 - Under the hood: indexing algorithms and adaptive retrieval

16:20 - Real-world deployments and architectural trade-offs

18:40 - Open challenges and best practices

20:30 - Final thoughts and book recommendation

Resources:

- "Unlocking Data with Generative AI and RAG" by Keith Bourne - Search for 'Keith Bourne' on Amazon and grab the 2nd edition

- Visit Memriq.ai for more AI practitioner tools, resources, and deep dives

  continue reading

22 एपिसोडस

Artwork
iconसाझा करें
 
Manage episode 523867881 series 3705596
Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal

Unlock the core infrastructure powering retrieval-augmented generation (RAG) systems in this technical deep dive. We explore how vector embeddings and vector stores work together to enable fast, scalable, and semantically rich retrieval for LLMs, drawing insights directly from Chapter 7 of Keith Bourne’s book.

In this episode:

- Understand the role of high-dimensional vectors and vector stores in powering RAG

- Compare embedding models like OpenAIEmbeddings, BERT, and Doc2Vec

- Explore vector store technologies including Chroma, Milvus, Pinecone, and pgvector

- Deep dive into indexing algorithms like HNSW and adaptive retrieval techniques such as Matryoshka embeddings

- Discuss architectural trade-offs for production-ready RAG systems

- Hear real-world applications and operational challenges from embedding compatibility to scaling

Key tools & technologies mentioned:

OpenAIEmbeddings, BERT, Doc2Vec, Chroma, Milvus, Pinecone, pgvector, LangChain, HNSW, Matryoshka embeddings

Timestamps:

00:00 - Introduction to vectors and vector stores in RAG

02:15 - Why vectors are the backbone of retrieval-augmented generation

05:40 - Embedding models: trade-offs and use cases

09:10 - Vector stores and indexing: Chroma, Milvus, Pinecone, pgvector

13:00 - Under the hood: indexing algorithms and adaptive retrieval

16:20 - Real-world deployments and architectural trade-offs

18:40 - Open challenges and best practices

20:30 - Final thoughts and book recommendation

Resources:

- "Unlocking Data with Generative AI and RAG" by Keith Bourne - Search for 'Keith Bourne' on Amazon and grab the 2nd edition

- Visit Memriq.ai for more AI practitioner tools, resources, and deep dives

  continue reading

22 एपिसोडस

All episodes

×
 
Loading …

प्लेयर एफएम में आपका स्वागत है!

प्लेयर एफएम वेब को स्कैन कर रहा है उच्च गुणवत्ता वाले पॉडकास्ट आप के आनंद लेंने के लिए अभी। यह सबसे अच्छा पॉडकास्ट एप्प है और यह Android, iPhone और वेब पर काम करता है। उपकरणों में सदस्यता को सिंक करने के लिए साइनअप करें।

 

त्वरित संदर्भ मार्गदर्शिका

अन्वेषण करते समय इस शो को सुनें
प्ले