AI Series: Mengenal Large Language Models

Kita hidup di era ketika mesin mulai bisa membaca, menulis, menerjemahkan, merangkum, bahkan berdebat, ada satu teknologi yang menjadi pondasinya: kecerdasan buatan. Seri tulisan ini hadir untuk membongkar lapisan demi lapisan teknologi tersebut, mulai dari bagaimana komputer belajar memahami bahasa manusia, apa yang sebenarnya terjadi ketika kamu mengetik pertanyaan ke ChatGPT atau Claude, hingga mengapa model-model ini bisa terasa begitu “pintar”. Dalam seri tulisan ini kita akan mempelajari dasar-dasar, bagaimana menggunakan AI, mendeploy AI secara lokal, bahkan melatih model LLM.

Artificial Intelligence (AI) adalah bidang ilmu komputer yang bertujuan menciptakan sistem yang mampu meniru kecerdasan manusia mulai dari belajar, bernalar, memecahkan masalah, hingga memahami bahasa. Sederhananya, AI adalah usaha kita untuk membuat mesin “berpikir”.

Natural Language Processing (NLP) adalah cabang AI yang memungkinkan komputer untuk memahami, menginterpretasikan, dan menghasilkan bahasa manusia. NLP menjembatani gap antara cara manusia berkomunikasi (natural language) dengan cara mesin memproses informasi.

🧠 Machine Learning

AI yang belajar dari data tanpa diprogram secara eksplisit. Semakin banyak data, semakin cerdas sistemnya.

👁 Computer Vision

Kemampuan mesin untuk “melihat” dan menginterpretasikan gambar atau video, seperti sistem pengenalan wajah.

💬 Natural Language Processing

Cabang AI yang fokus pada interaksi antara komputer dan bahasa manusia — tertulis maupun lisan.

🤖 Deep Learning

Sub-bidang ML menggunakan jaringan saraf tiruan berlapis dalam (deep neural networks) untuk mengenali pola kompleks.

Setiap kali kamu menggunakan Google Translate, mengetik ke mesin pencari, atau bicara dengan asisten virtual seperti Siri itu semua adalah NLP yang sedang bekerja di balik layar.

Tugas-tugas umum NLP meliputi: analisis sentimen (positif/negatif), klasifikasi teks, penerjemahan otomatis, ringkasan dokumen, ekstraksi informasi, dan men-generate teks seperti yang dilakukan ChatGPT atau Claude.

Contoh AI Populer

Dalam beberapa tahun terakhir, ekosistem AI berkembang pesat. Berikut adalah beberapa model dan sistem AI yang paling dikenal dan banyak digunakan saat ini:

🤖

ChatGPT
OpenAI · GPT-4o

🔷

Claude
Anthropic · Sonnet 4

✨

Gemini
Google DeepMind

🦌

Llama
Meta AI · Open Source

🐋

DeepSeek
DeepSeek · China

⚡

Grok
xAI · Elon Musk

Selain model bahasa, ada juga AI terkenal di bidang lain: DALL-E dan Midjourney untuk generasi gambar, Sora dan Runway untuk generasi video, AlphaFold dari DeepMind untuk prediksi struktur protein, dan GitHub Copilot untuk pembantu coding.

Semua model AI percakapan yang disebut di atas semuanya adalah LLM (Large Language Models). Itulah yang akan kita bahas lebih dalam di bagian selanjutnya.

Apa itu Text To Vector?

Komputer tidak bisa memahami kata-kata secara langsung, mereka hanya mengerti angka. Lalu bagaimana komputer bisa “memahami” teks? Jawabannya adalah melalui proses mengubah teks menjadi vektor, yang dikenal sebagai Text Embedding atau Word Embedding.

Sebuah vektor adalah representasi matematis dari sebuah kata atau kalimat dalam ruang berdimensi tinggi, dengan kata-kata dengan makna mirip berada berdekatan satu sama lain.

Bayangkan sebuah peta koordinat 2D, tapi dalam ratusan atau ribuan dimensi. Kata “Raja” dan “Ratu” berada berdekatan karena maknanya serupa. Kata “Apel” dan “Jeruk” juga berdekatan. Hubungan antar kata bahkan bisa dihitung secara matematis:

Contoh relasi vektor kata

vektor("Raja") − vektor("Pria") + vektor("Wanita") ≈ vektor("Ratu")

Inilah keajaiban word embedding — makna tersimpan dalam angka!

Teknik populer yang menghasilkan word embedding antara lain Word2Vec (Google, 2013), GloVe (Stanford), dan yang terbaru adalah embedding berbasis Transformer yang digunakan dalam LLM modern. Semakin canggih model, semakin kaya dan akurat representasi vektornya.

Similarity Search

Menemukan dokumen paling relevan dengan pertanyaan user berdasarkan kedekatan vektor. Digunakan di search engine dan RAG.

Vector Database

Database khusus untuk menyimpan dan mencari vektor dengan cepat. Contoh: Pinecone, Weaviate, Chroma, Qdrant.

Apa itu LLM?

Large Language Model (LLM) adalah model AI yang dilatih dengan jumlah data teks yang sangat besar untuk memahami dan menghasilkan bahasa manusia. Kata “Large” merujuk pada dua hal: ukuran data pelatihan dan jumlah parameter dalam model.

LLM modern hampir semuanya dibangun di atas arsitektur Transformer, yang diperkenalkan Google pada paper “Attention is All You Need” (2017). Kunci inovasinya adalah mekanisme self-attention, yaitu kemampuan model untuk mempertimbangkan konteks dari seluruh teks secara bersamaan, bukan kata per kata secara berurutan.

Cara kerja LLM secara sederhana: LLM menerima teks input → mengubahnya menjadi token → memproses melalui ratusan layer transformasi → menghasilkan prediksi kata berikutnya berdasarkan probabilitas → mengulang hingga jawaban selesai.

Proses pelatihan LLM terdiri dari dua tahap utama: Pre-training (belajar dari dataset besar secara unsupervised) dan Fine-tuning (disesuaikan untuk tugas spesifik, sering menggunakan RLHF — Reinforcement Learning from Human Feedback) agar model lebih aman dan berguna.

Pre-training

Model belajar dari triliunan token teks dari internet, buku, kode, dan sumber lainnya. Sangat mahal — bisa miliaran dolar.

Fine-tuning

Model disesuaikan agar bisa mengikuti instruksi, bersikap sopan, dan menghindari konten berbahaya.

RLHF

Manusia memberikan feedback terhadap respons model untuk melatih model agar lebih sesuai dengan preferensi manusia.

Inference

Saat model yang sudah terlatih digunakan untuk menjawab pertanyaan baru. Inilah yang terjadi setiap kamu chatting.

Apa itu Token dalam LLM

LLM tidak memproses teks karakter per karakter atau kata per kata. Unit terkecil yang diproses LLM disebut token. Token bisa berupa sebuah kata utuh, sebagian kata, tanda baca, atau bahkan spasi.

Contoh tokenisasi kalimat

Kalimat: “Kecerdasan buatan mengubah dunia!”

Ke cer dasan bu atan meng ubah dunia !

9 token untuk kalimat di atas (bisa berbeda tergantung tokenizer yang digunakan)

Sebagai gambaran: 1 token ≈ 0,75 kata dalam bahasa Inggris. Jadi 100 token ≈ 75 kata. Bahasa Indonesia dan non-Latin cenderung membutuhkan lebih banyak token per kata karena tokenizer dioptimalkan untuk bahasa Inggris.

Context Window

Batas maksimum token yang bisa diproses model sekaligus. Claude punya 200K token, GPT-4 punya 128K token.

Biaya API

LLM dikenai biaya per token — baik input (pertanyaan) maupun output (jawaban). Semakin panjang teks, semakin mahal.

Mau hitung token? Coba platform.openai.com/tokenizer atau tiktokenizer.vercel.app. Paste teksmu dan lihat bagaimana model memotongnya menjadi token!

Apa itu Parameter dalam LLM

Jika token adalah “makanan” yang dikonsumsi LLM, maka parameter adalah “kecerdasan” yang dimilikinya. Parameter adalah bobot numerik (angka-angka) yang tersimpan di dalam neural network model, yaitu hasil dari proses pelatihan berbulan-bulan menggunakan ribuan GPU.

Setiap parameter menyimpan sedikit “pengetahuan” tentang bahasa, fakta dunia, logika, atau pola. Ketika model menjawab pertanyaanmu, jutaan hingga miliaran parameter ini berinteraksi secara matematis untuk menghasilkan respons yang tepat.

Perbandingan Ukuran Model Populer

Llama 3.2 (kecil)

Llama 3.1 (mid)

DeepSeek R1

GPT-4 (estimasi)

B = Miliar (Billion) · T = Triliun (Trillion) parameter

Namun, lebih banyak parameter tidak selalu berarti lebih baik. Model yang lebih kecil tetapi dilatih dengan data berkualitas tinggi dan teknik fine-tuning canggih bisa mengalahkan model yang lebih besar. Ini adalah prinsip di balik kesuksesan model-model efisien seperti Mistral 7B atau Phi-3 dari Microsoft.

Model dengan 7 miliar parameter membutuhkan sekitar 14 GB VRAM GPU untuk berjalan. Model 70B butuh ~140 GB. Inilah mengapa LLM besar hanya bisa dijalankan di cloud, bukan di laptop biasa.

Demikian tulisan ini, semoga bermanfaat dan Happy Coding!

PakarPBN

A Private Blog Network (PBN) is a collection of websites that are controlled by a single individual or organization and used primarily to build backlinks to a “money site” in order to influence its ranking in search engines such as Google. The core idea behind a PBN is based on the importance of backlinks in Google’s ranking algorithm. Since Google views backlinks as signals of authority and trust, some website owners attempt to artificially create these signals through a controlled network of sites.

In a typical PBN setup, the owner acquires expired or aged domains that already have existing authority, backlinks, and history. These domains are rebuilt with new content and hosted separately, often using different IP addresses, hosting providers, themes, and ownership details to make them appear unrelated. Within the content published on these sites, links are strategically placed that point to the main website the owner wants to rank higher. By doing this, the owner attempts to pass link equity (also known as “link juice”) from the PBN sites to the target website.

The purpose of a PBN is to give the impression that the target website is naturally earning links from multiple independent sources. If done effectively, this can temporarily improve keyword rankings, increase organic visibility, and drive more traffic from search results.

Jasa Backlink

Download Anime Batch

Tags: language, Large, Mengenal, Models, Series