Red de conocimiento informático - Problemas con los teléfonos móviles - ¿Cuáles son las bibliotecas para extraer resúmenes de texto en Python?

¿Cuáles son las bibliotecas para extraer resúmenes de texto en Python?

1. google ganso

1

2

3

4

5

6

7

8

9

10

11

12

gt;gt;gt; de ganso importar ganso

gt;gt;gt; url = 'n.com/2012/02/22/ world/europe/uk-occupy-london/index.html?hpt=ieu_c2'

gt;gt;gt; g = Goose()

gt;gt;gt; = g.extract(url=url)

gt;gt;gt; artículo.title

u'Occupy London pierde la lucha por el desalojo'

gt;gt ;gt; Article.meta_description

"Los manifestantes de Occupy London que han estado acampados frente a la emblemática Catedral de San Pablo durante los últimos cuatro meses perdieron su intento judicial para evitar el desalojo el miércoles en una decisión tomada por el Tribunal de Apelaciones de Londres. ."

gt;gt;gt;article.cleaned_text[:150]

(CNN) -- Manifestantes de Occupy London que han acampado frente a la emblemática Catedral de San Pablo durante el últimos cuatro meses perdieron su intento judicial de evitar

gt;gt;gt; s-cathedral-story-top.jpg

2.python SnowNLP

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16 p>

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

p>

42

4

3

44

45

46

47

48

49

from snownlp import SnowNLP

s = SnowNLP(u'Esto es realmente genial')

s.words # [u'this', u'thing ', eres'sinceramente',

# eres'muy', te'gusta']

s.tags # [(u'this', eres'), ( u'cosa', u'n'),

# (u'sincero', u'd'), (u'muy', u'd'),

# (u'like', u'Vg')]

s.sentiments # 0.9769663402895832 probabilidad de positivo

s.pinyin # [u'zhe', u'ge', u'dong', u'xi',

# u'zhen', u'xin', u'hen', u'zan']

s = SnowNLP(u 'Los términos "chino tradicional" y "chino tradicional" también son muy comunes en Taiwán ')

s.han # u'Los términos "chino tradicional" y "chino tradicional"

# también es muy común en Taiwán. '

text = u'''

El procesamiento del lenguaje natural es una dirección importante en el campo de la informática y la inteligencia artificial.

Estudia diversas teorías y métodos que pueden lograr una comunicación efectiva entre humanos y ordenadores utilizando el lenguaje natural.

El procesamiento del lenguaje natural es una ciencia que integra la lingüística, la informática y las matemáticas.

Por lo tanto, la investigación en este campo involucrará el lenguaje natural, es decir, el lenguaje que las personas utilizan todos los días.

Por lo que está muy relacionado con el estudio de la lingüística, pero también. Tiene importante la diferencia.

El procesamiento del lenguaje natural no es el estudio del lenguaje natural en general,

sino el desarrollo de sistemas informáticos que puedan realizar eficazmente la comunicación en lenguaje natural,

especialmente el software. sistema. Por tanto forma parte de la informática.

'''

s = SnowNLP(texto)

s.keywords(3) # [u'idioma', u'natural', u' Computer']

s.summary(3) # [u'Entonces es parte de la informática',

# u'El procesamiento del lenguaje natural es una disciplina que integra la lingüística y Ciencias de la Computación,

#Matemáticas en una sola ciencia',

# u'El procesamiento del lenguaje natural es un campo importante en el campo de la informática y la inteligencia artificial

# dirección']

s.sentences

s = SnowNLP([[u'this', u'article'],

[u'that ', u'papel'],

[u'this']])

s.tf

s.idf

s.sim([u'artículo'])# [0.3756070762985226, 0, 0]