ما وراء شريط البحث: هندسة On-Device Vector Search باستخدام Expo و SQLite VSS

لفترة طويلة، كانت المعمارية المتبعة للبحث المدعوم بالـ AI متوقعة: التقاط استعلام المستخدم، إرساله إلى السيرفر، توليد Embedding عبر OpenAI، ثم الاستعلام من Pinecone أو Weaviate، وأخيراً إعادة النتائج. هذه الطريقة تعمل، لكنها بطيئة (Latent)، مكلفة، وتمثل كابوساً للخصوصية عندما يتعلق الأمر ببيانات المستخدم الحساسة.

مؤخراً، قررت كسر هذه الحلقة. أردت معرفة ما إذا كان بإمكاني جلب Vector Similarity Search عالي الأداء مباشرة إلى تطبيق Expo. هدفي؟ عمليات بحث محلية في أقل من 10 مللي ثانية وبدون تكاليف نقل بيانات (Egress costs).

إليك كيف هندست حلاً باستخدام SQLite VSS ونظام ملفات Expo الحديث.

تحول الهيكلية (The Architecture Shift)

نقل الـ Vector Search إلى الـ Edge (هاتف المستخدم) يتطلب ثلاثة أشياء:

Storage: قاعدة بيانات محلية تفهم الـ Vectors.
Indexing: طريقة لإجراء عمليات بحث K-Nearest Neighbor (KNN) دون فحص خطي لكل قاعدة البيانات.
Embeddings: طريقة لتحويل النص إلى أرقام محلياً (باستخدام transformers.js أو مكتبات مشابهة).

بينما تعتبر expo-sqlite هي المعيار الصناعي للبيانات المحلية، إلا أنها لا تدعم الـ Vector types بشكل افتراضي. هنا يأتي دور sqlite-vss — وهي إضافة مبنية على Faiss.

الاختراق التقني: إدخال VSS إلى Expo

تطبيق Expo Go القياسي لا يتضمن إضافة sqlite-vss. ولجعل هذا الأمر يعمل، كان علي الانتقال إلى عالم Development Builds.

العقبة التقنية هي أن sqlite-vss عبارة عن إضافة مكتوبة بلغة C++. باستخدام expo-sqlite/next (الـ API الجديد عالي الأداء)، يمكننا نظرياً تحميل الإضافات، لكن العمل الثقيل يحدث في إعدادات الـ Native build.

1. إعداد الـ Virtual Table

بمجرد ربط الإضافة، يحدث السحر من خلال الـ Virtual Tables. على عكس جداول SQL القياسية، جداول vss0 محسنة لمصفوفات الأرقام العشرية عالية الأبعاد (High-dimensional floating-point arrays).

sql

-- Create a virtual table for 384-dimensional embeddings (standard for All-MiniLM-L6-v2)
CREATE VIRTUAL TABLE vss_notes USING vss0(
  note_embedding(384)
);

-- Create a standard table for the actual content
CREATE TABLE notes (
  id INTEGER PRIMARY KEY,
  content TEXT,
  category TEXT
);

2. إدراج البيانات

عندما يقوم المستخدم بحفظ ملاحظة، أقوم بتوليد الـ Embedding على الـ Main thread (أو Web worker) وإدراجه في كلا الجدولين. يتوقع جدول vss_notes مصفوفة JSON من الأرقام.

typescript

import * as SQLite from 'expo-sqlite';

const db = await SQLite.openDatabaseAsync('local_ai.db');

async function saveNote(id: number, content: string, embedding: number[]) {
  await db.withTransactionAsync(async () => {
    // Save raw content
    await db.runAsync('INSERT INTO notes (id, content) VALUES (?, ?)', [id, content]);
    
    // Save vector index
    await db.runAsync(
      'INSERT INTO vss_notes(rowid, note_embedding) VALUES (?, ?)',
      [id, JSON.stringify(embedding)]
    );
  });
}

الاستعلام: Semantic Search في أقل من 10 مللي ثانية

هنا يظهر ثمار المجهود الهندسي. بدلاً من استخدام LIKE %query% التقليدية، نقوم بإجراء بحث عن التشابه. توفر SQLite VSS دالة vss_search وهي فعالة للغاية.

typescript

async function semanticSearch(queryEmbedding: number[], limit: number = 5) {
  const results = await db.getAllAsync(`
    SELECT 
      n.content, 
      v.distance
    FROM vss_notes v
    JOIN notes n ON v.rowid = n.id
    WHERE vss_search(v.note_embedding, ?) 
    ORDER BY v.distance ASC
    LIMIT ?
  `, [JSON.stringify(queryEmbedding), limit]);
  
  return results;
}

في تجاربي على جهاز iPhone 14، استغرق الاستعلام في مجموعة بيانات تضم 1,000 مستند حوالي 6 مللي ثانية. هذا أسرع مما يمكن لأي API round-trip أن تحلم به.

التغلب على قيود الذاكرة (Memory Constraint)

شيء واحد تعلمته بالطريقة الصعبة: الـ Embeddings ثقيلة.

إذا كان لديك 10,000 صف مع Vectors بـ 1536 بعداً (بأسلوب OpenAI)، فسوف يتضخم ملف SQLite بشكل كبير. للحفاظ على سرعة التطبيق، اخترت نماذج بـ 384 بعداً (مثل bge-small-en). إنها توفر توازناً مثالياً بين الدقة الدلالية (Semantic accuracy) واستهلاك الذاكرة على الجهاز.

لماذا يهمنا هذا الأمر؟

كمهندسين محترفين، غالباً ما نتجه تلقائياً لحلول الـ Cloud لأنها "أسهل" في التنفيذ. لكن الهندسة الموجهة للجهاز أفضل للمستخدم. من خلال الاحتفاظ بالـ Vectors في sqlite-vss:

Offline first: يعمل البحث في تطبيقك في الأنفاق أو على الطائرة.
Zero Latency: تبدو تحديثات واجهة المستخدم فورية.
Privacy: أفكار المستخدم الخاصة (ملاحظاته، مذكراته، أو بياناته) لا تغادر السيليكون الموجود في جيبه أبداً.

كلمات أخيرة

الفجوة بين ما يمكن أن يفعله الـ Backend وما يمكن أن يفعله الهاتف المحمول تتقلص. إذا كنت تبني تطبيق Expo في عام 2024، فلا تكتفِ ببناء شريط بحث عادي — بل ابنِ محرك ذكاء محلي (Local intelligence engine).

أقوم حالياً بالتجربة مع طرق الـ Quantization لتناسب مجموعات Vectors أكبر في ذاكرة الهاتف. إذا كنت قد تعاملت مع الـ Local indexing، سأكون سعيداً بسماع نهجك في التعليقات.

ما وراء شريط البحث: هندسة On-Device Vector Search باستخدام Expo و SQLite VSS

إليك كيف هندست حلاً باستخدام SQLite VSS ونظام ملفات Expo الحديث.

تحول الهيكلية (The Architecture Shift)

نقل الـ Vector Search إلى الـ Edge (هاتف المستخدم) يتطلب ثلاثة أشياء:

Storage: قاعدة بيانات محلية تفهم الـ Vectors.
Indexing: طريقة لإجراء عمليات بحث K-Nearest Neighbor (KNN) دون فحص خطي لكل قاعدة البيانات.
Embeddings: طريقة لتحويل النص إلى أرقام محلياً (باستخدام transformers.js أو مكتبات مشابهة).

الاختراق التقني: إدخال VSS إلى Expo

تطبيق Expo Go القياسي لا يتضمن إضافة sqlite-vss. ولجعل هذا الأمر يعمل، كان علي الانتقال إلى عالم Development Builds.

1. إعداد الـ Virtual Table

sql

-- Create a virtual table for 384-dimensional embeddings (standard for All-MiniLM-L6-v2)
CREATE VIRTUAL TABLE vss_notes USING vss0(
  note_embedding(384)
);

-- Create a standard table for the actual content
CREATE TABLE notes (
  id INTEGER PRIMARY KEY,
  content TEXT,
  category TEXT
);

2. إدراج البيانات

typescript

import * as SQLite from 'expo-sqlite';

const db = await SQLite.openDatabaseAsync('local_ai.db');

async function saveNote(id: number, content: string, embedding: number[]) {
  await db.withTransactionAsync(async () => {
    // Save raw content
    await db.runAsync('INSERT INTO notes (id, content) VALUES (?, ?)', [id, content]);
    
    // Save vector index
    await db.runAsync(
      'INSERT INTO vss_notes(rowid, note_embedding) VALUES (?, ?)',
      [id, JSON.stringify(embedding)]
    );
  });
}

الاستعلام: Semantic Search في أقل من 10 مللي ثانية

typescript

async function semanticSearch(queryEmbedding: number[], limit: number = 5) {
  const results = await db.getAllAsync(`
    SELECT 
      n.content, 
      v.distance
    FROM vss_notes v
    JOIN notes n ON v.rowid = n.id
    WHERE vss_search(v.note_embedding, ?) 
    ORDER BY v.distance ASC
    LIMIT ?
  `, [JSON.stringify(queryEmbedding), limit]);
  
  return results;
}

التغلب على قيود الذاكرة (Memory Constraint)

شيء واحد تعلمته بالطريقة الصعبة: الـ Embeddings ثقيلة.

لماذا يهمنا هذا الأمر؟

Offline first: يعمل البحث في تطبيقك في الأنفاق أو على الطائرة.
Zero Latency: تبدو تحديثات واجهة المستخدم فورية.
Privacy: أفكار المستخدم الخاصة (ملاحظاته، مذكراته، أو بياناته) لا تغادر السيليكون الموجود في جيبه أبداً.

ذكاء محلي أولاً: هندسة Vector Search مباشرة في Expo باستخدام SQLite VSS

ما وراء شريط البحث: هندسة On-Device Vector Search باستخدام Expo و SQLite VSS

تحول الهيكلية (The Architecture Shift)

الاختراق التقني: إدخال VSS إلى Expo

1. إعداد الـ Virtual Table

2. إدراج البيانات

الاستعلام: Semantic Search في أقل من 10 مللي ثانية

التغلب على قيود الذاكرة (Memory Constraint)

لماذا يهمنا هذا الأمر؟

كلمات أخيرة

ذكاء محلي أولاً: هندسة Vector Search مباشرة في Expo باستخدام SQLite VSS

ما وراء شريط البحث: هندسة On-Device Vector Search باستخدام Expo و SQLite VSS

تحول الهيكلية (The Architecture Shift)

الاختراق التقني: إدخال VSS إلى Expo

1. إعداد الـ Virtual Table

2. إدراج البيانات

الاستعلام: Semantic Search في أقل من 10 مللي ثانية

التغلب على قيود الذاكرة (Memory Constraint)

لماذا يهمنا هذا الأمر؟

كلمات أخيرة