نظرًا لمحدودية موارد معالجة سلاسل العمل، فمن المرجح أن تُوضع الطلبات الواردة التي لا يملك المعالجون القدرة على معالجتها في قائمة الانتظار، وقد تضيع وقتًا في انتظار توفر سلسلة عمل. عندما تكون جميع الاستعلامات تقريبًا قصيرة، فإن هذه الثواني القليلة (0.4 مللي ثانية) قد تكون مهمة. مع ذلك، انتبه إلى الحالات الحدية عندما يكون متوسط زمن الاستجابة في حدود 1 مللي ثانية، أي عندما يكون ضغط الطلبات شديدًا لدرجة أن أحد الخيوط قد يُستنفد. "تقريبًا" أكثر من ذلك بقليل يعني، بشكل دوري، أنه قد يكون هناك عدد أكبر قليلًا من المحاولات.
الأوضاع
يحتاج مُجزئ BPE إلى ملف دمج BPE خارجي (توجيه bpe_merges_file). لإنشاء مُرشِّح Bloom الجديد، أقوم Booi APK تسجيل الدخول بتكرار الرموز البديلة الثلاثية الخمسة التالية، ثم حذفها، وحساب قيم التجزئة، ووضع عدة أجزاء لكل رمز داخل مُرشِّح Bloom ذي 128 جزءًا. باختصار، يتم تحديد الرموز البديلة على نص غير مُجزَّأ تقريبًا، مع تطبيق جدول charset_dining فقط لجعل الحالات قابلة للطي. ما هي الثلاثيات التي سيتم حذفها تحديدًا (والتي يُمكن الاحتفاظ بها في مُرشِّح Bloom)؟
بما في ذلك المقالات
قائمة بالمجالات لإنشاء تجزئات الرموز الداخلية، والتي ستُستخدم خلال يوم الفهرسة. قائمة بالمجالات للبحث عن فئات الرموز الخاصة بك، ويمكنك تخزين نظارات المجموعة ذات الصلة التي ستُستخدم خلال يوم الفهرسة. تُستخدم مقالات Field_string بشكل أساسي كعمود واحد ممتاز لعرض نص كامل وتخزينه في ذاكرة الوصول العشوائي (RAM). استخدم هذا المجال للحصول على مجالات صغيرة مثل عناوين المستندات، ولكن استخدم DocStore للحصول على مجالات كبيرة مثل المقالات. لذلك، ابحث عن field_string في قناة الخدمات داخل ذاكرة الوصول العشوائي، أو عن held_industries في محطة DocStore على القرص الصلب، على التوالي.
أوقات مثيرة للغاية تقضيها في حركة ساخنة
تُعدّ فهارس Sphinx مجموعات شبه جاهزة من المستندات. لذا، ما الأفضل، استخدام عناكب RT، تعريفات ملف sphinx.conf أم تعليقات إدارة سطح المكتب؟ لإضافة عمود جديد، يجب إما نسخ فهرس واحد، أو استخدام تقرير التغييرات. يُمكّنك ملف التكوين أيضًا من إدارة عناكب RT. يُعدّ sql_query_pre مكانًا مناسبًا لعبارة إنشاء السلسلة، وهذا يُوجّهك إلى خيارات التكوين (التي نُشير إليها عادةً باسم التوجيهات داخل Sphinx). يجب أن يكون sql_ask الأولي هو مُعرّف المستند.

يجب أن تُرجع مخططات النتائج النهائية قيمة واحدة فقط (عدد عشري). مع ذلك، يجب تخزين قيمتين (مجموع وحدود الصف) أثناء معالجة الصفوف الجديدة. تتطلب عمليات التحديد قائمة مخصصة من العناصر، وقد تستخدم تعبيرات OR، لذا يوجد دائمًا مخطط مجموعة نتائج. بطبيعة الحال، يجب أن يكون هناك مخطط فهرس محدد يصف جميع خصائص الفهرس. تُجرى تحسينات على كل عملية هنا، ولكن مع ذلك، إذا كنت تستخدم الكثير من هذه القيم (لفرز أو تصفية أداء الاستعلام)، فستلاحظ فرقًا في الأداء.
مع كل ما سبق، لنبدأ بالبحث، ويمكنك البدء بخطوات صغيرة، مع مراعاة الاستفسارات الأسهل أولاً! بالإضافة إلى ذلك، فإن مجالات محددة، سواء كانت مرتبطة بـ "انظر" أم لا، لها أقسامها الخاصة بالوثائق. خدمات MVA (المعروفة أيضًا باسم خدمات المواقع الصحيحة) هي الاستثناء الوحيد الذي لا يمكن نقله بمجرد بحث/تغيير بسيط (يمكن القول إن استخدام تعبير نمطي بسيط يكفي).
عناكب FAISS_Dot
يمكن استخدام اقتراحات متعددة، ويمكن إدراج العديد من فهارس الميزات، في أي عملية شراء تقريبًا. يمكن استخدام أفكار الدليل لضبط سلوك مُحسِّن الاستعلام واستخدام قائمة السمات، وذلك لتحسين الأداء أو تصحيح الأخطاء في بعض الأحيان. يُعدّ See أداة الاستعلام الرئيسية، ولذلك، يتميز ببنية شاملة للغاية (وربما معقدة بعض الشيء). هناك العديد من الأجزاء (أو البنود) لهذه البنية. على سبيل المثال، اذكر كيفية حذف قيمة jac. لا تقم بإزالة أي تفكير قديم. يتم إما التخلص منه أو استبداله بتفكير جديد.