¿Cuál debo elegir entre análisis de datos y backend web Zhihu?
Cuál elegir entre análisis de datos y back-end web Zhihu
La diferencia entre "front-end" y "back-end" en el desarrollo WEB es la siguiente: p>
1. Front-end web:
1) Dominar HTML y poder escribir estructuras HTML con semántica razonable, estructura clara y fácil mantenimiento.
2) Competente en CSS, capaz de restaurar el diseño visual y compatible con los principales navegadores reconocidos por la industria.
3) Estar familiarizado con JavaScript, comprender el contenido básico de ECMAScript y dominar 1 o 2 marcos js, como JQuery.
4) Tener una comprensión clara de los problemas comunes de compatibilidad de los navegadores. y tener una solución confiable.
5) Tener ciertos requisitos de rendimiento, comprender las sugerencias de optimización del rendimiento de Yahoo y poder implementarlas de manera efectiva en el proyecto.
2. Backend web:
1) Competente en jsp, servlet, java bean, JMS, EJB, Jdbc, desarrollo Flex o muy familiarizado con herramientas, bibliotecas de clases y frameworks relacionados. Familiarizado con, como Velocity, Spring, Hibernate, iBatis, OSGI, etc., tener un conocimiento profundo de los modelos de desarrollo web
2) Practique el uso de sistemas de bases de datos de uso común como Oracle, SQLServer, MySQL, etc. ., y tener un sólido conocimiento de las bases de datos. Sólidas capacidades de diseño.
3) Se dará prioridad a los solicitantes que estén familiarizados con las herramientas de gestión de configuración de proyectos de Maven, familiarizados con servidores de aplicaciones como Tomcat y Jboss, y que tengan experiencia relevante en el ajuste de carga en condiciones de procesamiento de alta concurrencia.
4 ) Competente en técnicas de diseño y análisis orientado a objetos, incluidos patrones de diseño, modelado UML, etc.
5) Familiarizado con la programación de redes, con experiencia y capacidad en el diseño y desarrollo de interfaces API externas, así como diseño de especificaciones de API multiplataforma y capacidades de diseño de llamadas eficientes de API
- La diferencia entre análisis de datos y minería de datos Zhihu
1. El análisis de datos se centra en los datos de observación Se centra en la minería de datos sobre descubrimiento de datos Reglas de conocimiento KDD (Descubrimiento de conocimientos en la base de datos);
2. El análisis y la conclusión de datos concluyen de manera inteligente la conclusión de la minería de datos. El conjunto de aprendizaje automático (o conjunto de entrenamiento, este conjunto) descubre reglas de conocimiento;
3. La conclusión del análisis de datos utiliza la minería de datos inteligente para descubrir la aplicación directa de reglas de conocimiento para la predicción.
4. El análisis de datos puede establecer modelos numéricos que requieren modelado de ingeniería y completa directamente el modelado matemático. La esencia del modelado cibernético tradicional describe la relación funcional entre las variables de entrada y las variables de salida. La minería de datos utiliza máquinas para establecer la relación entre las funciones de entrada y salida dando un conjunto de parámetros de entrada y cantidades de salida de acuerdo con las reglas KDD. p> - Cómo recopilar datos de back-end para el análisis de datos
La recopilación de datos generales se divide en recopilación de datos de página y recopilación de datos API, la recopilación generalmente se realiza en lenguaje Python y el análisis de datos generalmente se realiza en función de En el marco de Python, hay muchos datos recopilados de forma gratuita en los datos de origen, que se pueden descargar directamente si está interesado.
Qué libro de SQL para el análisis de datos
1. Estadísticas básicas: media, mediana, moda, percentil, valor extremo, etc.
2. Otras estadísticas descriptivas: asimetría, varianza, desviación estándar , significancia, etc.
3. Otros conocimientos estadísticos: población y muestra, parámetros y estadísticas, ErrorBar
4. Distribución de probabilidad y prueba de hipótesis: cada distribución, proceso de prueba de hipótesis p>
5. Otros conocimientos de teoría de la probabilidad: probabilidad condicional, bayesiano y otras especialidades de análisis de datos comerciales Zhihu
Puede poner su GPA, especialidad Cuando la información se ingresa en el sistema de referencia de la solicitud de estudios en el extranjero, el sistema comparará automáticamente los casos de estudiantes con situaciones similares al tuyo desde la base de datos para ver a qué universidades y carreras han solicitado con éxito
De esta manera podrás ver Descubre en qué nivel de universidades y carreras puedes Solicite según su nivel actual y ubíquese con precisión.
¿Qué aplicación de análisis de datos es mejor?
Hay muchas aplicaciones de análisis de datos, incluidas estadísticas, análisis y pruebas. Puedes ir a la aplicación para comprobarlas con antelación y tienen muchas funciones. ¿Cuál es mejor para el análisis de datos entre Python y R?
En 2012, dijimos que R era la corriente principal en el mundo académico, pero ahora Python está reemplazando lentamente la posición de R en el mundo académico. No sé si es por la llegada de la era del big data.
Python es más rápido comparado con R. Python puede procesar directamente los datos de G; R no puede. Cuando R analiza los datos, necesita convertir los datos grandes en datos pequeños a través de la base de datos (a través de groupby) antes de poder entregárselos a R para su análisis. Es imposible que R analice directamente los detalles del comportamiento. Solo puede analizar resultados estadísticos. Entonces algunas personas dicen: Python = R SQL/Hive, lo cual no es descabellado.
Una de las ventajas más obvias de Python son sus características de lenguaje adhesivo. Esto también se menciona en muchos libros. Algunos algoritmos subyacentes escritos en C son muy eficientes cuando se encapsulan en paquetes de Python.
(El análisis del árbol de decisiones en el paquete de minería de datos de Python, Orange canve
, produce resultados para 500.000 usuarios en 10 segundos, pero no se puede producir ni siquiera con R durante varias horas y la memoria 8G está completamente ocupada). Sin embargo, nada es absoluto. Si la programación vectorial de R se hace bien (es un poco difícil), mejorará significativamente la velocidad de R y la duración del programa.
La ventaja de R es que tiene funciones estadísticas integrales que se pueden llamar, especialmente en el análisis de series de tiempo. Tanto los métodos clásicos como los de vanguardia tienen paquetes correspondientes para uso directo.
En comparación, Python era bastante pobre en esta área antes. Sin embargo, ahora Python tiene pandas. pandas proporciona un conjunto estándar de herramientas de procesamiento de series temporales y algoritmos de datos. Como resultado, puede manejar de manera eficiente series de tiempo muy grandes, dividir/desmenuzar, agregar, remuestrear series de tiempo periódicas/periódicas, etc. Como habrás adivinado, la mayoría de estas herramientas son particularmente útiles para datos financieros y económicos, pero ciertamente también puedes usarlas para analizar datos de registro del servidor. Por ello, en los últimos años, Python ha mejorado continuamente sus bibliotecas (principalmente pandas), convirtiéndolo en una importante alternativa para las tareas de procesamiento de datos.
He realizado varios experimentos:
1. Implementé un método estadístico usando Python, que usaba ctypes y multiproceso.
Más tarde, cuando estaba comparando métodos para un proyecto, volví a R y descubrí que algunos paquetes en bioconductor ya usaban paralelo de forma predeterminada.
(Pero ese paquete sigue siendo muy lento y todos los subprocesos se agotan a la vez, lo que hace que toda la computadora quede inutilizable y la página web que se va a ver esté muy retrasada ~)
2. Utilice Python Pandas para Realice algún trabajo de clasificación de datos, similar a la base de datos, dos o tres tablas para verificar y combinar. Todavía se siente muy conveniente. Aunque R también puede realizar estas tareas, probablemente será más lento ya que hay cientos de miles de filas de entradas.
3. Utilice Python matplotlib para hacer dibujos. El método de dibujo de pylot es muy diferente al de R. R es un comando para dibujar algo aquí y allá, mientras que pylot saldrá junto cuando esté listo. La selección de colores de pyplot es un poco incómoda. Hay relativamente pocos colores predeterminados y los colores estarán disponibles más adelante, pero los nombres son demasiado largos ~. La leyenda de pyplot
es mucho más fácil de usar que R y está semiautomática. Después de dibujar en pyplot, puede acercar y alejar libremente y luego guardarlo como una imagen. Esto es más fácil de usar que R.
En términos generales, Python es un lenguaje relativamente equilibrado que se puede utilizar en todos los aspectos, ya sea llamando a otros lenguajes, conectando y leyendo fuentes de datos, operando el sistema o expresando expresiones regulares y procesando texto.
Python tiene ventajas obvias.
Y R es más prominente en las estadísticas. Pero el análisis de datos es en realidad más que solo estadísticas: incluye la recopilación temprana de datos, el procesamiento de datos, el muestreo de datos, la agrupación de datos y algoritmos de extracción de datos más complejos, modelado de datos, etc.
Siempre que estas tareas sean. 100M Es difícil para R manejar los datos anteriores, pero Python es básicamente competente.
Combinado con su gran fortaleza en programación general, podemos crear aplicaciones centradas en datos usando solo Python.
Pero no existe el mejor software o programa del mundo, y pocas personas pueden aplicar la minería en un solo lenguaje al extremo. En particular, muchas personas han aprendido R antes, pero ahora no lo usan en absoluto y son reacias a desprenderse de él. Por lo tanto, para aquellos que quieran aplicar lo que han aprendido, sería mejor si pudieran combinar R. y pitón. ¿Qué es mejor, el análisis de datos o el big data?
La formación en big data del Big Podium responderá a tus preguntas:
1. Big data (big data):
Se refiere a datos que no se pueden procesar en un Las colecciones de datos que se capturan, gestionan y procesan con herramientas de software convencionales dentro de un marco de tiempo asequible son información masiva, de alto crecimiento y diversa que requiere nuevos modelos de procesamiento para tener un mayor poder de toma de decisiones. , descubrimiento de conocimientos y capacidades de optimización de procesos;
En "La era del big data" escrito por Victor Meier-Schoenberg y Kenneth Cukier, big data se refiere al uso de atajos como el análisis aleatorio (muestreo). encuestas) sin necesidad de atajos. Todos los datos son analizados y procesados. Las características 5V del big data (propuestas por IBM): Volumen, Velocidad, Variedad, Valor, Veracidad
2. Análisis de datos:
Se refiere al proceso de analizar una gran cantidad de los datos recopilados utilizando métodos de análisis estadístico apropiados, extrayendo información útil y formando conclusiones, y luego realizando una investigación detallada y un resumen de los datos. Este proceso es también un proceso de soporte del sistema de gestión de calidad. En términos prácticos, el análisis de datos ayuda a las personas a emitir juicios para poder tomar las medidas adecuadas.
La base matemática del análisis de datos se estableció a principios del siglo XX, pero no fue hasta la aparición de las computadoras que las operaciones prácticas se hicieron posibles y se promovió el análisis de datos. El análisis de datos es una combinación de matemáticas e informática. Un novato quiere cambiar de carrera, ¿cuál debería estudiar, front-end web o análisis de datos?
Con el rápido desarrollo de Internet, la industria del software se ha vuelto más popular. Vinculado a la industria del software, y la industria del software se ha convertido en un símbolo de salarios altos. Como lenguaje de desarrollo de software muy popular en los últimos años, el front-end web ha recibido elogios y favores unánimes de muchas personas. Dado que el front-end web es tan popular, las perspectivas de aprender este curso son, por supuesto, más prometedoras.
Mientras trabajes duro para aprender cosas reales, tu futuro no será malo. Si desea aprender bien sobre desarrollo web front-end, generalmente alrededor de 20,000 yuanes, debe echarle un vistazo según sus necesidades reales. Después de la audición, puede elegir el que más le convenga, espero que pueda ayudarlo. ¿Los analistas de datos necesitan aprender Hadoop? Zhihu
El ecosistema de Hadoop es una parte importante del desarrollo y análisis de big data y debe centrarse en el aprendizaje.