Напишите функцию lemmatize(text). На вход она принимает текст из корпуса и возвращает лемматизированную строку. Возьмите первый текст из датасета tweets.csv. Код напечатает на экране исходный и лематизированный тексты.
!pip install pymystem3 -q
import pandas as pd
from pymystem3 import Mystem
data = pd.read_csv('https://code.s3.yandex.net/datasets/tweets.csv')#'/datasets/tweets.csv')
corpus = data['text'].values.astype('U')
def lemmatize(text):
m = Mystem()
return "".join(m.lemmatize(text))
print("Исходный текст:", corpus[0])
print("Лемматизированный текст:", lemmatize(corpus[0]))