Sentence-BERT

Індексація баз даних з використанням алгоритмів глибинного навчання

Автоматизація індексації в базах даних є ключовим напрямом розвитку сучасних систем управління базами даних, що дозволяє підвищити швидкодію, масштабованість і релевантність пошуку в умовах великих обсягів інформації. У статті досліджено застосування алгоритмів глибинного навчання для побудови та оптимізації векторних індексів, здатних автоматично адаптуватися до змін структури даних і запитів. Проведено експериментальне порівняння традиційних методів індексації (B-Tree, GIN у PostgreSQL) з векторною індексацією, реалізованою на основі моделей Sentence-BERT у системах FAISS і Milvus.

Інтелектуальний аналіз текстових даних у соціальних мережах із використанням BERT і XGBoost

У цій статті представлено комплексний підхід до аналізу настроїв у соціальних мережах із застосуванням сучасних методів опрацювання тексту та алгоритмів машинного навчання. Основний фокус — інтеграція моделі Sentence-BERT для векторизації тексту та XGBoost для класифікації настроїв. Використовуючи набір даних Sentiment140, було проведено широке дослідження текстових повідомлень, позначених анотаціями настроїв. Модель Sentence-BERT дозволяє генерувати високоякісні векторні представлення текстових даних, зберігаючи як лексичні, так і контекстуальні зв’язки між словами.