Red de conocimiento informático - Aprendizaje de código fuente - El inventor del método de entrada Sogou

El inventor del método de entrada Sogou

La historia de Ma Zhankai-----el padre del método de entrada Sogou

¿Cómo puede el método de entrada chino, un "páramo" que necesita mejoras urgentes pero que carece de oportunidades de negocio, se convierten en el principal campo de batalla de la innovación

Después de la masiva “polémica por plagio” entre Sohu y Google hace unos meses, ahora se puede reevaluar el valor del método de entrada para una empresa de Internet: Sohu emitió un comunicado el 8 de abril diciendo que Google Pinyin después de plagiar el diccionario de métodos de entrada de Sogou, el precio de las acciones de Sohu aumentó en casi un 50%. El año anterior, el precio de las acciones de Sohu cayó un 18%. Aunque es ingenuo atribuir los cambios periódicos en el precio de las acciones al resultado de una determinada fuerza, una afirmación más precisa es: a través de un software de método de entrada de varios megabytes de tamaño, Sohu, con un valor de mercado de casi 1.200 millones de dólares, ha vuelto a Wall Street apalancado. Pasión por uno mismo.

¿Cómo empezó esto? Respuesta: Este es el resultado de innovar por pereza.

En 2005, Ma Zhankai, que acababa de graduarse y trabajaba como diseñador mecánico en una empresa estatal en Taiyuan, encontró un método que le ahorraba trabajo: al escribir algo, si el El método de entrada no pudo escribir directamente las palabras requeridas, no estaba dispuesto a ingresarlas. En lugar de buscar página tras página la palabra que desea escribir en la lista de palabras, ingrese el pinyin correspondiente (por ejemplo: zhoujielun) en el cuadro de búsqueda. ¿Obtienes el mensaje correspondiente del motor de búsqueda ("Estás buscando: Jay Chou")? Copiar y pegar desde aquí.

Este joven, que no tiene conocimientos de informática pero puede realizar más de cien búsquedas cada día, adivinó una vez una explicación: el motor de búsqueda tiene un léxico enorme que se organiza manualmente. Pero después de investigar un poco, descubrió que los motores de búsqueda aprovechan al máximo las palabras clave ingresadas por los usuarios. Cada vez que el volumen de búsqueda de una determinada palabra clave alcanza un número determinado, como millones de veces, la palabra clave se incluye automáticamente en el motor de búsqueda. lista. En otras palabras, cuesta muy poco utilizar un motor de búsqueda para generar un enorme tesauro de palabras de uso común. Esto hace que Ma Zhankai sienta vagamente que permitir que los motores de búsqueda utilicen métodos de entrada tiene un gran potencial.

Si hubiera conocido a alguien en la industria de métodos de entrada en ese momento, su idea se habría destrozado sin piedad: ¿Quién entraría en la industria de métodos de entrada en 2005? Ya en las décadas de 1980 y 1990, Microsoft adquirió sucesivamente ABC inteligente y Microsoft Pinyin y los incluyó en el sistema operativo Windows. Desde entonces, ha habido algunos trabajos de programadores privados y, en 2005, esto casi se había convertido en un campo de oligopolio: Smart ABC, Ziguang Pinyin, Pinyin Jiajia y Microsoft Pinyin representan el 90% del mercado de métodos de entrada.

En teoría, todos estos productos tienen un amplio margen de mejora. Todos son léxicos compilados manualmente, lo cual es costoso e ineficaz. Muchas palabras no se pueden incluir en el léxico a tiempo. Ziguang Pinyin, que ocupa el primer lugar en el mercado, ni siquiera lanzó una versión mejorada desde 2003 hasta principios de 2006.

Pero el poder de las empresas bloquea el impulso de mejora. El método de entrada es un producto que no es ni popular ni popular. Aunque los usuarios chinos inevitablemente lo utilizarán, no pueden obtener ningún ingreso con él. Como resultado, el estado del campo del método de entrada es: hay personas que ven constantemente la demanda del mercado y constantemente fabrican nuevos productos que resuelven ciertos problemas, pero nadie puede persistir en el proceso de actualización y mantenimiento frecuente y a largo plazo.

Hasta cierto punto, Ma Zhankai lo cambió todo. Hoy en día, es el gerente de producto de Sogou Input Method. Su método de entrada creativo y diseñado proporciona a Sohu un nuevo canal para llegar a una amplia gama de usuarios: la undécima versión del método de entrada se lanzará a finales de agosto y la versión 11 del método de entrada se lanzará a finales de agosto. El nuevo producto estará vinculado a las cuentas de usuario. Puede utilizar su propio método de entrada personalizado en diferentes computadoras con la misma cuenta. Por lo tanto, el método de entrada y el blog juntos se convierten en la entrada a todo el producto Sohu, lo que tendrá un efecto positivo en la promoción de sus noticias, comunidad y otros productos.

Más importante aún, desde que QQ se apoderó de los escritorios de 400 millones de usuarios de Internet como un torbellino, el software cliente ha demostrado su enorme imaginación. El método de entrada es uno de los software más complicados y utilizados con más frecuencia en el cliente. Por ejemplo, el número de descargas de Ziguang Pinyin en 2005 fue superado sólo por el QQ de Tencent, con alrededor de 200 a 300 millones de descargas.

Cansado

Cuando la industria tecnológica de China no estaba muy comercializada, los métodos de entrada eran el campo con mayor innovación: además de Pinyin y Wubi, también había docenas de códigos naturales, etc. Productos relacionados.

Ya a fines de la década de 1980, Wang Xiaolong, un estudiante de doctorado en el Instituto de Tecnología de Harbin, desarrolló un sistema de método de entrada que admitía la entrada de oraciones completas. Posteriormente fue adquirido por Microsoft y se convirtió en Microsoft Pinyin. En los primeros días, en el campo de los métodos de entrada, también existía el nuevo método de entrada Pinyin proporcionado por "Chinese Star" y el inteligente ABC que luego también fue adquirido por Microsoft. El recuerdo de "Chinese Star" dejado por muchas personas se ha desvanecido. Sin embargo, los desarrolladores de este producto que permite a las computadoras reconocer el chino incluyen a Wang Zhidong, el fundador de Sina, y Liao Hengyi, el fundador de Pinyin Jiajia.

Sobre estas bases, en 1996 se lanzó el famoso método de entrada Dark Horse. Su desarrollador Wang Li ha pasado más de tres años en Lenovo Hanka y ha acumulado una rica experiencia en el procesamiento chino. En ese momento, este entusiasta de la tecnología dejó Lenovo porque Lenovo quería hacer arreglos para que él asumiera un puesto gerencial y se unió a Dark Horse Feiteng Technology Co., Ltd., liderando el desarrollo de tecnología de revisión y tomándose el tiempo para desarrollar "Black Horse Shenpin". ".

No hace mucho, cuando la disputa entre Sogou y Google era intensa, Wang Xiaofeng, uno de los bloggers más famosos de China, elogió la alta calidad de Dark Horse Shenpin, que se ha utilizado durante muchos años. en su blog, lo que provocó la sospecha del mundo exterior sobre Dark Horse.

Wang Li clasificó el método de entrada Black Horse como un método de entrada de tercera generación que es diferente de los métodos de entrada de palabras Wubi, ABC inteligente y Sogou. Tiene una alta precisión al ingresar oraciones completas. La biblioteca de oraciones de Heima Pinyin proviene de contenido de texto escrito, como periódicos y obras literarias, y tiene una función de aprendizaje automático, que no solo elimina la aparición de palabras incorrectas, sino que también tiene un nivel muy alto de inteligencia. Sin embargo, el método de entrada Black Horse también tiene un punto débil fatal: es de gran tamaño, con más de 400 megabytes, lo que no favorece la difusión.

Pero con la mala conexión a Internet de la época, esto no fue un problema. Basándose en las ventas de CD, Heima Shenpin aportó ingresos inesperados a Heima Company. A día de hoy, Dark Horse sigue adoptando este modelo de ventas.

Sin embargo, en 2001, considerando que su competidor era el poderoso Microsoft y que el método de entrada no podía proporcionar los fondos necesarios para la empresa, Wang Li renunció a seguir actualizando el método de entrada y se concentró en Dark. Para el negocio de revisión de textos de Horse, solo quedan para ventas y cooperación la versión 2001 de Heima Shenpin y algunas tecnologías subyacentes del método de entrada.

Liao Hengyi, que no pudo encontrar un método de entrada adecuado y simplemente desarrolló Pinyin Gajia él mismo, dejó de desarrollar y actualizar Pinyin porque la tarifa de registro mensual de cientos de yuanes no podía soportarlo.

Por supuesto, estas personas no han intentado encontrar formas comerciales de agregar valor al método de entrada, sino que solo se quedan en el método de gestión personal estilo webmaster. Por ejemplo, Liao Hengyi una vez colocó un cuadro de búsqueda de Baidu en la página de inicio de Pinyin Gajia y luego cooperó con Baidu para compartir los ingresos. Más tarde, Liao Hengyi simplemente configuró la página de inicio en una página de navegación similar a hao123.com. De esta manera, podía ganar alrededor de 100.000 yuanes en ingresos cada mes, y esto puso fin a los días de detener las actualizaciones.

“La financiación y la cotización en bolsa son una oportunidad, pero solo soy un técnico superior y el proceso es demasiado complicado de comprender”, dijo Wang Li.

Como resultado, los fundadores de estos métodos de entrada casi sólo consideran los métodos de entrada como un "trabajo secundario", pero todos invariablemente invierten en software empresarial, un campo que está "más cerca del dinero".

Esto le dio a Ma Zhankai, como un lego en la industria de Internet, la oportunidad de llamar a la puerta de Sohu con una redefinición de los productos de método de entrada basada en la experiencia de un usuario senior de Internet a mediados de 2005: tamaño pequeño, fácil de difundir en Internet; puede encontrar palabras interesantes; tiene un equipo dedicado para operar y actualizarse rápidamente.

Buscando a Bole

Era el primer aniversario de Ma Zhankai en el trabajo. Finalmente no pudo soportar el tedio y la lentitud de las empresas estatales y renunció con dinero prestado de familiares y. Amigos, vino aquí solo. El propósito original de ir a Beijing era aprender algunas habilidades y luego encontrar un trabajo.

En Beijing, lo que nos impactó fue el entusiasmo ardiente de Internet: por un tiempo, Kai-fu Lee dejó Microsoft y vino a Google China, Yahoo firmó un acuerdo de adquisición con Alibaba y Baidu estaba a punto de ¡Hágalo público y las perspectivas eran prometedoras! Esto revivió la idea de los métodos de entrada en la mente de Ma.

Media hora antes de que Baidu se hiciera público, Ma Zhankai se recostó frente a la computadora y escribió un correo electrónico a Baidu de acuerdo con la dirección de correo electrónico del servicio al cliente en línea. Explicó brevemente la creatividad del método de entrada: incluido el. Solicitudes pinyin predeterminadas para búsquedas de Baidu en la biblioteca de fuentes. Junto con la función de actualización sincrónica de la base de datos en línea, las palabras populares en Internet aparecerán inmediatamente en el vocabulario del método de entrada.

Después de enviarlo, mamá esperó inquietamente una respuesta y la buscó mentalmente por miedo a perderse alguna sugerencia que pudiera atraer la atención de los demás. Al mediodía del día siguiente, Ma agregó una carta y una propuesta para integrar las funciones de búsqueda de Baidu y de escritorio en el método de entrada. Sin embargo, después de unos días, siguió actualizando su buzón y solo recibió una respuesta de rutina de Baidu sin más intenciones de negociación o cooperación.

Ma no estaba dispuesta a ceder. Después de enviar varios correos electrónicos más pero aún sin llegar a ninguna parte, decidió cambiarse a Sohu. Esta vez, Ma Zhankai recibió una respuesta rápida y entusiasta. La gente de Sohu expresó gran interés y le pidió a Ma Zhankai que fuera a la oficina para discutirlo en tres días.

Ma Zhankai no desperdició los tres días de espera. Se concentró en permanecer frente a la computadora, usar constantemente motores de búsqueda y leer teorías relevantes, tratando de prepararse para la entrevista que tanto le costó ganar. Entonces, tres días después, antes de ir a Sohu, envió los resultados de estos tres días de anticipación: un documento de 30 páginas, que incluía decenas de miles de palabras de notas de búsqueda, 200 puntos de inspiración y 100 pequeñas ideas.

Esta familiaridad con los motores de búsqueda y el pensamiento de producto ayudó a Ma Zhankai a conseguir con éxito un segundo trabajo, convirtiéndose en gerente de producto de Sohu.

Ma decidió seguir presionando al vicepresidente de Sohu, Wang Jianjun. Para ser más convincente, contó las descargas de QQ y los métodos de entrada en los principales sitios web de descarga, analizó a los competidores en el campo de los métodos de entrada uno por uno e hizo dos PPT. Muestra: QQ tiene alrededor de 500 millones de descargas, mientras que el método de entrada tiene entre 200 y 300 millones de descargas. Después de ver el PPT por segunda vez, Wang dejó claro: debemos hacerlo.

De hecho, el desarrollo de métodos de entrada tiene mucho que ver con el cambio estratégico de Sohu. En 1998, Zhang Chaoyang imitó el modelo de directorio web de Yahoo para establecer Sohu y comenzó una operación de portal grande y completa. Sin embargo, alrededor de 2003, este enfoque basado en contenidos comenzó a flaquear. La clave del dolor de Sohu es que en muchos productos importantes, como búsqueda, mensajería instantánea, etc., Sohu está muy por detrás porque su tecnología es inferior a la de sus competidores.

Poco después, Sohu estableció un centro de investigación y desarrollo, principalmente para fortalecer la investigación y el desarrollo de tecnología en el campo de la búsqueda, es decir, para desarrollar el motor de búsqueda Sogou. En primer lugar, a largo plazo, la búsqueda es una dirección importante para el desarrollo de Internet. En segundo lugar, la búsqueda en sí tiene un alto contenido técnico y la tecnología desarrollada también puede irradiarse a otras áreas de productos de Sohu. Al principio, el centro de I+D era muy confidencial. No estaba en el mismo edificio de oficinas que Sohu y no había ningún cartel en la casa. Dado que está en el mismo piso que el centro de I+D de NetEase, Zhang Chaoyang tiene que bajarse el ala del sombrero cada vez que va allí, por miedo a ser reconocido por otros empleados.

Incluso si se adopta un enfoque tan secreto, el desafío sigue siendo obvio: Baidu ha acumulado tecnología durante cuatro años, ¿en qué avance puede confiar Sogou para ponerse al día?

Mientras los ejecutivos de Sohu tenían dolor de cabeza por este asunto, la creatividad del método de entrada estaba justo frente a ellos. "El desarrollo de métodos de entrada es fruto del proceso de desarrollo de la tecnología de búsqueda de Sogou y también puede mejorar la imagen de marca de Sogou", dijo a Global Entrepreneur Wang Xiaochuan, vicepresidente de tecnología de Sohu.

Wang Xiaochuan es el jefe del equipo técnico que coordina el desarrollo del método de entrada. Cuando fracasó la adquisición de Ziguang Pinyin, en octubre de 2005, un grupo de varias personas comenzó a explorar la tecnología. No fue hasta el 5 de junio de 2006 que se lanzó la primera versión del método de entrada Sogou. ocho luna.

De hecho, debido al bajo uso del motor de búsqueda de Sogou, las funciones de recordatorio de pinyin y corrección de errores aún no se habían implementado en ese momento, por lo que no fue fácil organizar y filtrar el tesauro.

Además de buscar palabras clave, la "campaña de léxico" también utilizó casi todos los recursos de Sohu. Por ejemplo, los desarrolladores quieren una lista de sustantivos de información geográfica de go2map.com, una lista de canciones y nombres de cantantes de Sohu Music Search y una lista de estrellas deportivas y sustantivos de eventos de canales deportivos. ¿La cooperación entre departamentos consume mucha energía? y tiempo.

Además, debido a que las palabras provienen de Internet, en comparación con Heima Shenpin y otros, un problema importante que Sogou necesita resolver son las palabras incorrectas. Sogou publicará un informe de errores de palabras cada semana para corregir errores en el vocabulario. Por esta razón, en los diez meses transcurridos desde que se lanzó la primera versión, Sogou Input Method ha lanzado una nueva versión casi todos los meses, corrigiendo constantemente errores de vocabulario, mejorando la precisión y agregando algunas pequeñas funciones para atraer a los usuarios, como máscaras del método de entrada, léxico personalizado.

Por lo tanto, tan pronto como se lanzó este método de entrada emergente, inmediatamente logró los resultados esperados y apareció rápidamente en los escritorios de innumerables personas, reemplazando la posición original de Ziguang.

Las reglas de entrada de Google van un paso más allá y pueden vincularse a cuentas en línea. En otras palabras, no importa en qué computadora estés, puedes iniciar sesión en tu cuenta personal y utilizar la biblioteca de vocabulario con la que ya estás familiarizado. Al mismo tiempo, la “búsqueda con un clic” de Google hizo que los empleados de Sogou lamentaran el poder del efecto de marca.

Ma Zhankai dijo que su idea original también incluía la "búsqueda con un clic", es decir, integrar la búsqueda en el cuadro del método de entrada. Se ha discutido varias veces, pero se ha dejado en suspenso. La razón por la que no se ha implementado es que Sogou tiene cuidado de no ser confundido con "software fraudulento". Esto afectará la experiencia del usuario y no generará muchas búsquedas. volumen", cree mamá.

Algunas personas en la industria dijeron que en el campo técnico, las capacidades técnicas de Sogou y Google Input Method no son sólidas y no son tan buenas como Dark Horse y Microsoft. Pero los avances de Sohu y Google en cuanto a facilidad de uso les permitieron tener éxito temporalmente.

En un resumen PPT, Ma Zhankai escribió: Antes de Gmail, todos pensaban que el correo electrónico era así. Antes del método de entrada de Sogou, todos pensaban que el método de entrada era así. Muchos campos de Internet chinos aún no han comenzado. Todavía hay muchas oportunidades para operaciones comerciales.

Para los métodos de insumo, la comercialización apenas ha comenzado y hay muchas posibilidades de éxito.