процедура кодування

Удосконалення методів зберігання текстових даних

У дослідженні проаналізовано якісні характеристики повідомлень у месенджері Telegram, використаних як вихідні дані для подальшого аналізу текстового контенту. Здійснено ретельний огляд параметрів цих повідомлень, таких як їх формат, розмір, наявність шумів та швидкодія. Основна мета статті – моделювання оптимального підходу до збереження великого обсягу даних перед важливим етапом аналізу тексту. Під час дослідження детально проаналізовано літературні джерела із цієї тематики.

Beyond JSON: Evaluating Serialization Formats for Space-Efficient Communication

Distributed systems rely on efficient inter-service communication, heavily impacted by data transmission costs. This study investigates alternative serialization formats, like Avro and MessagePack, to reduce data size compared to the common JSON format. We utilize a custom model to comprehensively assess the space efficiency of serialization formats across various data types. Our findings demonstrate that adopting alternative formats achieves a median reduction in serialized data exceeding 30 %.

Програмна модель кодів Ріда-Соломона

Розроблена програма для моделювання завадостійких кодів Ріда-Соломона на основі об’єктно-орієнтованої технології. Вхідними даними для системи є блоки байтів для передачі через канал зв’язку, де в цих блоках можуть статися помилки. Створена програма реалізує коди типу (255,239) та (255,223) для скінченого поля з 256 елементів GF(28) зі стандартними породжуючими багаточленами x8+x4+x3+x2+1 та x8+x7+x2+x+1. Крім того, передбачена можливість у випадку необхідності додати інші типи кодів та багаточлени, які породжують скінченне поле.