අපි මේ ඉන්නෙ Generative AI ගැන පැහැදිලි අවබෝධයක් ලබාගන්නා ලිපි මාලාවේ සිව්වැනි ලිපිය සමග.මේකෙන් අපි කතා කරනවා Language Models ගැන.
Developersලාට සහ IT Organizations වලට පුලුවන් ඔවුන්ටම වෙන්වුනු AI Language model එකක් නිර්මාණය කරගන්න. හැබැයි මේ දේ ලොකු ප්රවණතාවයක් විදියට ලෝකයේ දකින්න හම්බෙන්නෙ නැහැ. ඒ වෙනුවට ගොඩක් ආයතන කැමතියි pre-trained foundation models මේකට භාවිත කරන්න. එතකොට ඒ අයට තිබෙන්නෙ ඒ models, custom data පාවිච්චි කරලා වෙනස්කම් කරගන්න විතරයි.
Microsoft Azure වලත් මේ වගේම AI models හොයාගන්න පුලුවන්. Azure OpenAI Service සහ Model Catalog කියන්නෙ ඒ වගේ දෙකක්. Model Catalog කියන්නෙත් ඉහත සදහන් කළා වගේම developersලා සහ data scientistsලා භාවිත කරන pre trained model එකක්.
Microsoft Azure වල භාවිතා වෙන මූලික models 3ක් තිබෙනවා.
- GPT Models (from OpenAI): ChatGPT හා Microsoft’s AI වල භාවිතා වෙනවා
- GPT-3.5-Turbo, GPT-4, GPT-4o: chat based models
- GPT-4 Turbo with Vision: chat හා රූප යන වර්ග දෙකටම භාවිත වෙනවා
- DALL-E Model: ඡායාරූප නිර්මාණය කිරීම හා වෙනස් කිරීම
- Secure & Scalable: Azure hosts තමයි මේවා භාවිත කරන්නෙ, security සහ reliability පවත්වාගෙන යාමට
අපි භාවිත කරන language models ප්රධාන වර්ග දෙකකට වෙන් කරන්න පුලුවන්.
- Large Language Models (LLMs)
- Small Language Models (SLMs)
අපි දැන් මේවාගේ වෙනස්කම් බලමු.
Large Language Models (LLMs) | Small Language Models (SLMs) |
---|---|
මේවා train කරන්න අති විශාල දත්ත ප්රමාණයක් භාවිත කරනවා internet හා අනෙක් පොදු මූලාශ්ර වලින් | මේවා train වෙන්නෙ ප්රමාණයෙන් කුඩා, ඒ වගේම දත්ත ප්රමාණය නිශ්චිත dataset වලින් |
පරාමිතීන් නැත්නම් parameters බිලියන, ට්රිලියන ගනන් උනත් තිබෙන්න පුලුවන් | Have fewer parameters than LLMs.
LLM එක්ක බලද්දි parameters ප්රමාණය අඩුයි. |
text generation කරන්න පුලුවන් ඉතා විශාල පරාසයක් පුරා පැතිරුණු මාතෘකා හා සංවාද සම්බන්ධව | සාමාන්ය සංවාද වලදි සාර්ථක නැහැ. නමුත් තමන්ගේ විෂය තුල සාකච්ඡා වල ප්රවීණයන් |
local මට්ටමේ devices වල වැඩ කරන්න අමාරුයි වගේම computing power එක සෑහෙන්න අවශ්යයි. | Local devices වල වැඩ කරන්න පහසුයි සහ කළමණාකරනය කරගන්න පහසුයි |
අපි මීලග ලිපියෙන් සාකච්ඡා කරමු Microsoft විශේෂ LLM එකක් වුන Microsoft Copilot ගැන.