Прошу помочь с лемматизацией столбца с помощью библиотеки natasha

Question

Прошу вашей помощи: есть столбец df['cleaned_review'] с обратной связью от клиента, хочу его лемматизировать с помощью библиотеки natasha и сохранить в столбец df['lemmatized']

Пробовал импортировать из библиотеки from natasha import MorphVocab

и с помощью кода:

   "".join(MorphVocab(word).lemmatize() for word in x.split())) ```

получить, но не работает...ОШИБКА:
``` TypeError: __init__() takes 1 positional argument but 2 were given

По самому тесту работоспособности: на входе "нравится ассортимент, много того, что не найде...", избавился от пунктуации, привел к нижнему регистру, а также избавился от stopwords ... на выходе хочу получить что то вроде "ассортимент найти другой магазин..."

Пробовал вариант:

   text = str(text) ```

где фидбек клиентов превратил в список.. и с помощью кода  
```from natasha import MorphVocab  
   morph_vocab = MorphVocab()  
   for token in doc.tokens:
       token.lemmatize(morph_vocab)  

   {_.text: _.lemma for _ in doc.tokens} ``` 

на выходе получаю  

```{'[': '[', 
  "'": "'",  
 'ангаре': 'ангар', 
 'нравится': 'нравиться', 
 'магазин': 'магазин',  
 'большой': 'большой',  
 'навигационнопонятный': 'навигационнопонятный',... ```

 Только вот хотелось бы оставить/сохранить все в новом столбце... –

БЛОГ НА HUSL

Прошу помочь с лемматизацией столбца с помощью библиотеки natasha

Ответы (0 шт):