Artwork

Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal
Player FM - पॉडकास्ट ऐप
Player FM ऐप के साथ ऑफ़लाइन जाएं!

Using LangChain to Get More from RAG (Chapter 11)

23:28
 
साझा करें
 

Manage episode 523994507 series 3705596
Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal

Unlock the full potential of Retrieval-Augmented Generation (RAG) with LangChain’s modular components in this episode of Memriq Inference Digest — Engineering Edition. We dive deep into Chapter 11 of Keith Bourne’s book, exploring how document loaders, semantic text splitters, and structured output parsers can transform your RAG pipelines for better data ingestion, retrieval relevance, and reliable downstream automation.

In this episode:

- Explore LangChain’s diverse document loaders for PDFs, HTML, Word docs, and JSON

- Understand semantic chunking with RecursiveCharacterTextSplitter versus naive splitting

- Learn about structured output parsing using JsonOutputParser and Pydantic models

- Compare tooling trade-offs for building scalable and maintainable RAG systems

- Hear real-world use cases across enterprise knowledge bases, customer support, and compliance

- Get practical engineering tips to optimize pipeline latency, metadata hygiene, and robustness

Key tools & technologies:

- LangChain document loaders (PyPDF2, BSHTMLLoader, Docx2txtLoader, JSONLoader)

- RecursiveCharacterTextSplitter

- Output parsers: StrOutputParser, JsonOutputParser with Pydantic

- OpenAI text-embedding-ada-002

Timestamps:

00:00 – Introduction and guest welcome

02:30 – The power of LangChain’s modular components

06:00 – Why LangChain’s approach matters now

08:30 – Core RAG pipeline architecture breakdown

11:30 – Tool comparisons: loaders, splitters, parsers

14:30 – Under the hood walkthrough

17:00 – Real-world applications and engineering trade-offs

19:30 – Closing thoughts and resources

Resources:

- "Unlocking Data with Generative AI and RAG" by Keith Bourne - Search for 'Keith Bourne' on Amazon and grab the 2nd edition

- Visit Memriq.ai for more AI engineering deep dives and resources

  continue reading

22 एपिसोडस

Artwork
iconसाझा करें
 
Manage episode 523994507 series 3705596
Keith Bourne द्वारा प्रदान की गई सामग्री. एपिसोड, ग्राफिक्स और पॉडकास्ट विवरण सहित सभी पॉडकास्ट सामग्री Keith Bourne या उनके पॉडकास्ट प्लेटफ़ॉर्म पार्टनर द्वारा सीधे अपलोड और प्रदान की जाती है। यदि आपको लगता है कि कोई आपकी अनुमति के बिना आपके कॉपीराइट किए गए कार्य का उपयोग कर रहा है, तो आप यहां बताई गई प्रक्रिया का पालन कर सकते हैं https://hi.player.fm/legal

Unlock the full potential of Retrieval-Augmented Generation (RAG) with LangChain’s modular components in this episode of Memriq Inference Digest — Engineering Edition. We dive deep into Chapter 11 of Keith Bourne’s book, exploring how document loaders, semantic text splitters, and structured output parsers can transform your RAG pipelines for better data ingestion, retrieval relevance, and reliable downstream automation.

In this episode:

- Explore LangChain’s diverse document loaders for PDFs, HTML, Word docs, and JSON

- Understand semantic chunking with RecursiveCharacterTextSplitter versus naive splitting

- Learn about structured output parsing using JsonOutputParser and Pydantic models

- Compare tooling trade-offs for building scalable and maintainable RAG systems

- Hear real-world use cases across enterprise knowledge bases, customer support, and compliance

- Get practical engineering tips to optimize pipeline latency, metadata hygiene, and robustness

Key tools & technologies:

- LangChain document loaders (PyPDF2, BSHTMLLoader, Docx2txtLoader, JSONLoader)

- RecursiveCharacterTextSplitter

- Output parsers: StrOutputParser, JsonOutputParser with Pydantic

- OpenAI text-embedding-ada-002

Timestamps:

00:00 – Introduction and guest welcome

02:30 – The power of LangChain’s modular components

06:00 – Why LangChain’s approach matters now

08:30 – Core RAG pipeline architecture breakdown

11:30 – Tool comparisons: loaders, splitters, parsers

14:30 – Under the hood walkthrough

17:00 – Real-world applications and engineering trade-offs

19:30 – Closing thoughts and resources

Resources:

- "Unlocking Data with Generative AI and RAG" by Keith Bourne - Search for 'Keith Bourne' on Amazon and grab the 2nd edition

- Visit Memriq.ai for more AI engineering deep dives and resources

  continue reading

22 एपिसोडस

सभी एपिसोड

×
 
Loading …

प्लेयर एफएम में आपका स्वागत है!

प्लेयर एफएम वेब को स्कैन कर रहा है उच्च गुणवत्ता वाले पॉडकास्ट आप के आनंद लेंने के लिए अभी। यह सबसे अच्छा पॉडकास्ट एप्प है और यह Android, iPhone और वेब पर काम करता है। उपकरणों में सदस्यता को सिंक करने के लिए साइनअप करें।

 

त्वरित संदर्भ मार्गदर्शिका

अन्वेषण करते समय इस शो को सुनें
प्ले