Подскажите инструмент для аннотирования (разметки) текста в котором текст можно отредактировать при необходимости в процессе разметки

Я попробовал большое количество инструментов с открытым исходным кодом. И ни в одном из них нет возможности поправить текст в процессе разметки.

Общая задача такая:

  1. Исходный текст это автоматическая транскрипция с аудио
  2. Разметчик (аннотатор) выделяет в тексте ключевые слова, определяет эмоциональный окрас употребления этих слов, добавляет каждому выделенному слову ключевое слово.
  3. Исправляет ошибки автоматической транскрибации

В таких иснтрументах как:

  • Label Studio
  • Diffgram
  • Classifai
  • И других менее известных

Ни в одном из этих инструментов напрочь нет возможности поправить текст в процессе разметки. Ко всему остальному "претензий" нет)

Существует ли инструмент, который позволяет редактировать текст в процессе разметки? И если нет то как в моем случае правильно выполнять разметку с точки зрения процесса?


Ответы (3 шт):

Автор решения: Khasan06

Попробуйте использовать инструмент doccano. Чуть поискал про него информацию, и говорят что он может справиться с вашей задачей. Самолично я не проверял но надеюсь что вам поможет)

→ Ссылка
Автор решения: Dmitri Galkin

Смотрели на Prodigy AI?

Во время разметки там можно редактировать текст

→ Ссылка
Автор решения: Dev18

INCEpTION — это инструмент для аннотирования, который позволяет редактировать текст во время аннотации. Попробуйте этот инструмент для исправления ошибок транскрипции и добавления аннотаций.

Brat - это инструмент с открытым исходным кодом, который позволяет размечать текст и при необходимости редактировать его. Вроде бы он обладает неплохими возможностями для разметки текста.

LightTag - это еще один пример инструмента для аннотирования и редактирования текста

tagtog - редактор текстовых аннотаций

Яшихина Е.В. (науч. рук. Вайгандт Н.Ю.) ОБЗОР ИНСТРУМЕНТОВ ДЛЯ РАЗМЕТКИ ТЕКСТОВЫХ ДАННЫХ

  • Как идея можно предложить доработки инструментов, те, что open source (Label Studio, Doccano) Вы можете форкнуть проект на GitHub и добавить функциональность редактирования текста.
→ Ссылка