一篇文章实习心得

2023-11-19

1、爬虫实习(2月)

如果公司已经搭建好了爬虫框架比如scrapy那么爬的方向可能也是固定的,代码复用率应该很高,只需要分析页面的逻辑,以及想要爬的字段,自己按照前辈写的代码修改就好了,如果公司没有搭建好框架,你是公司的第一个爬虫工程师,你要考虑对于爬取的数据是一次就够还是不定期都需要爬取,是否要搭建框架,只有当做的多了,需求一来,看看页面就知道做不做的了,后期可以往数据分析发展,大数据是以数据为基石的,爬虫正好可以提供数据

1.1爬取逻辑

首先找到想爬取数据的位置,通过查看网页源码,看其是否在网页源代码中,如果不在,通过查看xhr看其是否有加载的异步包,如果也没有就可以考虑通过selenium模拟真实浏览器获得网页源代码,如果还获取不到想要的数据,则要分析他的js加密过程,通过模拟加密算法,真实模拟用户获得想要的数据

1.2爬虫工具介绍

pycharm – python编译器
webstorm – js编译器
fiddler – 抓包工具
postman – 接口测试工具

2、测试实习(3月+)

我做的是一个app的测试,感悟比较深的是只有做了开发的技术岗,才知道有很多事情以及名词,只有亲身体会才会习以为常(线上、测试环境、联调、007…)

2.1app形成的过程

产品用axure设计出原型图后会交给ui做原型图的加工,样式按钮颜色等,ui将设计稿推送到蓝湖上,产品召开产品会议,在这个会议上,产品介绍app的整个业务逻辑,这个团队都必须参加这个会议,团队中的每个人要对这个产品的理解一致,方便以后的开发,为了提供有效的沟通以及问题的实时反馈可以使用teambition(敏捷开发的工具)或者使用(禅道)将项目的每一步都写在上面,每个任务开发团队都可以看到,接下来就是研发阶段,后台研发讨论数据库的设计,和前端以及产品共同定义接口返回值以及实现功能,编写接口文档,安卓、苹果、h5、后端开发人员,共同开发, 开发人员接口开发完毕在teambition中提交,测试人员先对接口的功能进行测试,小功能开发完毕,前后端联调,测试先测测试环境,在测预上线环境,做好压力测试后完成上线

2.2app开发软件介绍(只介绍了项目中用到的)

Axure —画原型图的工具
蓝湖 — ui做好设计稿推送的平台
禅道 – 对测试友好的项目管理平台
teambition – 对敏捷开发友好的项目管理平台
jenkins – 开发推送代码构建的平台
jmeter – 测试工具
IntelliJ IDEA – java编译器

3、对还没毕业的同学建议

有些事情只有当你实习后才知道怎么回事,如果你毕业想当一个程序员,就要早早的实习,把每个岗位都尝试一遍,运维、测试、前端、后端、、、如果你学校不是很好,我觉得上不上课都无所谓,如果你学校比较好那肯定老师教的比自己实习学到的好,我是从大四才开始实习计算机岗位的,觉得还有很多东西都没来的及尝试就要工作了,最迟大三开始实习,享受大一大二两年的愉悦大学时光,毕业后就不用像现在的我一样,有太多的遗憾,但是当你决定开始改变的一刻开始,不论何时都不算晚,加油打工人

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一篇文章实习心得 的相关文章

  • kafka的安装和使用

    ZooKeeper简介 ZooKeeper 是一个为分布式应用所设计的分布的 开源的 java 协调服务 分布式的应用可以建立在同步配置管理 选举 分布式锁 分组和命名等服务的更高级别的实现的基础之上 ZooKeeper 意欲设计一个易于编
  • C语言(二十一)

    1 查找指定字符 本题要求编写程序 从给定字符串中查找某指定的字符 输入 输入待查找的字符c以及字符串s 输出 找到则输出字符c在字符串s中所对应的最大下标index 否则输出 Not Found 优化目标 无 include
  • TCP/IP详解 卷1:协议 学习笔记 第二十九章 网络文件系统

    NFS 网络文件系统 使客户可以透明地访问服务器上的文件和文件系统 NFS的基础是RPC 两个常用的网络编程API socket和TLI 运输层接口 Transport Layer Interface 通信的双方可使用不同的API RPC可
  • 蚁剑的使用以及用蚁剑做一道ctf题

    一 蚁剑的介绍及下载 1 蚁剑是一款和菜刀相像的shell控制端软件 主要面向于合法授权的渗透测试安全人员以及进行常规操作的网站管理员 2 蚁剑的下载 这是gethub的官方下载地址 供大家下载 3 蚁剑的安装 点击初始化就完成安装 再次点
  • Linux进程管理:deadline调度器

    一 概述 实时系统是这样的一种计算系统 当事件发生后 它必须在确定的时间范围内做出响应 在实时系统中 产生正确的结果不仅依赖于系统正确的逻辑动作 而且依赖于逻辑动作的时序 换句话说 当系统收到某个请求 会做出相应的动作以响应该请求 想要保证
  • Jib使用小结(Maven插件版)

    小结三 多次构建后 积累的无用镜像 如下所示 构建多次后 本地会遗留多个名为 tag也是的镜像 root maven hellojib docker images REPOSITORY TAG IMAGE ID CREATED SIZE b
  • 懒人式迁移服务器深度学习环境(完全不需要重新下载)

    换服务器了 想迁移原来服务器上的深度学习环境 但又觉得麻烦懒得重新安装一遍anaconda pytorch 有没有办法能不费吹灰之力直接迁移 接下来跟着我一起 懒汉式迁移 本方法适用于在同一内网下的两台服务器之间互相迁移 不在同一局域网下的
  • 【华为OD统一考试B卷

    在线OJ 已购买本专栏用户 请私信博主开通账号 在线刷题 运行出现 Runtime Error 0Aborted 请忽略 华为OD统一考试A卷 B卷 新题库说明 2023年5月份 华为官方已经将的 2022 0223Q 1 2 3 4 统一
  • C++ primer智能指针(HasPtr)实现

    智能指针显然是C 吸引人的地方之一 必须掌握 看了 C primer 里面着重讲了智能指针的实现方式 书中说到 HasPtr 注 就是自定义的智能指针 在其它方面的行为与普通指针一致 具体而言 复制对象时 副本和原对象将指向同一基础对象 如
  • linux下libxml库的安装及编译

    linux下libxml库的安装及编译 1 下载和安装LIBXML2 Libxml2是个C语言的XML程式库 能简单方便的提供对XML文件的各种操作 并且支持XPATH查询 及部分的支持XSLT转换等功能 Libxml2的下载地址是 htt
  • Mysql8.0出现this is incompatible with sql_mode=only_full_group_by

    MySQL的sql mode模式说明及设置 sql mode是个很容易被忽视的变量 默认值是空值 在这种设置下是可以允许一些非法操作的 比如允许一些非法数据的插入 在生产环境必须将这个值设置为严格模式 所以开发 测试环境的数据库也必须要设置
  • phabricator mysql_搭建 Phabricator 我遇到的那些坑 - 简书

    一 可能会用到的命令 1 重启phd守护线程 先进入到Fabricator文件夹下面 然后 bin phd log 2 删除一个代码仓库 bin remove destroy rMOBILE 代码库的前缀名字 3 重启mysql数据库 su
  • 数据结构:力扣OJ题

    目录 编辑题一 链表分割 思路一 题二 相交链表 思路一 题三 环形链表 思路一 题四 链表的回文结构 思路一 链表反转 查找中间节点 本人实力有限可能对一些地方解释的不够清晰 可以自己尝试读代码 望海涵 题一 链表分割 现有一链表的头指针
  • Java8 新特性 之 lambda 表达 和 函数式接口

    lambda 表达式 概念 lambda 表达式是一个匿名函数 可以把 lambda 表达式理解为是一段可以传递的代码 更简洁 更灵活 使 Java 的语言表达能力得到了提升 lambda 表达式是作为接口的实现类的对象 万事万物皆对象 使
  • Java取模运算中余数的符号选择问题

    Java取模运算中 余数 的符号和 被除数 符号相同 除号前面的数 即与第一个数的符号相同 public class MyTestProgram public static void main String args 被除数 除数 商 被除
  • idea连接mysql注册登录_idea配置连接数据库的超详细步骤

    学习时 使用IDEA的时候 需要连接Database 连接时遇到了一些小问题 下面记录一下操作流程以及遇到的问题的解决方法 一 连接操作 简介 介绍如何创建连接 具体连接某个数据库的操作流程 1 1 创建连接 打开idea 点击右侧的 Da
  • 并行程序设计作业7/7

    目录 两个线程 一个生产者一个消费者 2k个线程 奇数消费者偶数生产者 2k个线程 每个既可以是生产者又可以是消费者 两个线程 一个生产者一个消费者 include
  • cmake policy

    1 cmake policy是什么 cmake policy可以理解为cmake的语法标准 也就是说 它规定了cmake在解析CMakeLists txt文件时的行为 2 cmake policy的用途是什么 cmake在进化的过程中 需要
  • CAN分析仪 USBCAN USB转CAN CAN转换调试器接口卡使用指导

    USBCAN系列便携式CAN分析仪 通过USB接口快速扩展一路CAN通道 使接入CAN网络非常容易 它具有一体式和小巧紧凑的外形 特别适合于随身携带 第一步 将usbcan卡连接电脑如图 usb灯亮红灯 打开 USBCAN系列便携式CAN总
  • 编程之美2015初赛第二场AB

    题目1 扑克牌 时间限制 2000ms 单点时限 1000ms 内存限制 256MB 描述 一副不含王的扑克牌由52张牌组成 由红桃 黑桃 梅花 方块4组牌组成 每组13张不同的面值 现在给定52张牌中的若干张 请计算将它们排成一列 相邻的

随机推荐

  • 2023.02

    2023 02 01 将mpu写到dxReagion中的数据打印到文件中 调试解决mpu2ipu和ipu2mpu同时跑线程未关掉导致的异常 2023 02 02 学习2102 spec文档和mpu设计文档 将mpuipu测试用例加到回归测试
  • SpringMVC访问静态资源问题

    搭建Spring MVC环境时 如果在Spring MVC的配置文件中DispatcherServlet拦截 则会对 html js jpg等静态文件的访问也会被拦截 想要访问这些静态资源必须要进行相应的配置这里推荐两中比较简单的方法 1
  • 【无监督学习】1、MOCOv1

    文章目录 一 背景 二 方法 2 1 对比学习 字典查表 2 2 动量对比函数 2 3 Pretext Task 三 效果 3 1 数据集 3 2 训练细节 3 3 实验 四 代码 论文 Momentum Contrast for Unsu
  • python中int什么意思_python 的 int() 函数是什么,怎么用

    int 函数是python的一个内置函数 用于把一个字符串或者数字转换为 整型 下面来具体看一下 工具 原料 IDLE 电脑 方法 步骤 1 int 的常用语法 int 字符串或者数字 进制数 进制数默认为十进制 如果int 中没有参数 返
  • PDF学习十:图形状态

    说明 一个PDF应用程序 Foxit Reader或Adobe Reader 维护内部数据结构称为图形状态 它保存了当前图形控制参数 这些参数定义在全局框架 在全局框架内可执行图形操作符 例如 f 填充 操作符隐式调用当前颜色这个参数 S
  • Python爬虫学习汇总(持续更新)

    最近在研究爬虫 我把和爬虫相关的内容都总结到这了 这持续更新 1 使用Python爬取妹子网的图片 批量下载 附带源码 超详细 2 爬虫实例源码下载 修改目录直接能运行 3 Python爬虫之xpath的基本使用 解析HTML详细介绍 4
  • CentOS7 最小化安装后的必备操作

    来源于 https blog csdn net f srion article details 54910943 在VM虚拟机中安装CentOS 7 时 有时候顾虑到电脑硬件性能 我们需要最小化安装 而最小化安装后与centos6的版本是有
  • 魔百盒 修改时间服务器,魔百盒网关服务器下发超时

    魔百盒网关服务器下发超时 内容精选 换一换 第三方应用在物联网平台订阅了设备服务信息变化通知后 订阅的通知类型为serviceInfoChanged 当平台向设备下发命令修改设备服务信息时 平台会向第三方应用推送通知消息 支持物联网平台向订
  • python的内置容器(list、set、tuple、dict)概念、使用及遍历方法

    容器概念 线性表 有序的容器结构 数组 array 是由连续的内存空间组成 栈 stack 先进后出 后进先出 队列 queue 先进先出 后进后出 链表 list 是由不连续的内存空间组了逻辑结构 单向链表 内存小 效率低 双向列表 内存
  • kubeadm 安装k8s

    关于k8s集群化部署 以下均是个人一步一步的完成部署 并且会罗列出在部署过程中遇到的各种问题及其解决方式 一 环境准备 环境准备阶段试用与master节点部署与work节点部署 即master和work节点全部都需要执行这些步骤 1 关闭防
  • LCR 005. 最大单词长度乘积----位掩码的使用

    题目描述 给定一个字符串数组 words 请计算当两个字符串 words i 和 words j 不包含相同字符时 它们长度的乘积的最大值 假设字符串中只包含英语的小写字母 如果没有不包含相同字符的一对字符串 返回 0 示例 1 输入 wo
  • javascript——js string 转 int 注意的问题——parseInt

  • Linux搭建C++开发调试环境的方法步骤

    安装g Linux编译C 程序必须安装g 编译器 这里使用yum方式安装 首先切换到root账号 su root 然后输入密码 执行yum install gcc c 注意不是yum install g 报错 报错是因为yum需要配置正确的
  • 安装启动配置mysql5.7_MySQL5.7多实例安装及开机启动配置(亲测)

    安装环境 CentOS版本 CentOS7 6 1810 MySQL版本 5 7 9 以前一些很low的方法是 解压两个mysql 分别放到不同文件夹 其实在mysql中已经考虑到了多实例安装的情况 也有相应的脚本命令的支持 现在安装两个m
  • 发牌程序 java

    题目要求 代码 package PokerGame import java util public class PokerGame 黑桃 红心 草花 方块 int m 牌数 int n 人数 int warning 0 有余数 int po
  • unity各种路径

    1 Resources路径 Resources文件夹是Unity里自动识别的一种文件夹 可在Unity编辑器的Project窗口里创建 并将资源放置在里面 Resources文件夹下的资源不管是否有用 全部会打包进 apk或者 ipa 并且
  • 什么是依赖注入

    什么是依赖注入 依赖注入指的是在Spring创建对象的过程中 把对象依赖的属性注入到对象中 依赖注入的方式主要包括 基于 set 方式注入 也即属性注入 基于构造器方式的注入 p命名空间注入 对应属性注入 c命名空间注入 对应构造器注入 p
  • [Java实现 Scoket实时接收Tcp消息 优化层层叠加]

    目录 前言 基础实现代码 描述 优化代码多线程处理客户端连接和消息接收 描述 再次优化异步实现 以下是使用 CompletableFuture 实现异步处理客户端请求的示例代码 描述 进一步优化的代码 Netty来实现Socket服务器 描
  • AntV 柱状图

    AntV 柱状图图表 Step 1 npm install antv g2 Step 2 创建柱状图容器 div div 代码截图 代码生成效果 源码 const chartData 0 date Jan num 4 1 date Feb
  • 一篇文章实习心得

    1 爬虫实习 2月 如果公司已经搭建好了爬虫框架比如scrapy那么爬的方向可能也是固定的 代码复用率应该很高 只需要分析页面的逻辑 以及想要爬的字段 自己按照前辈写的代码修改就好了 如果公司没有搭建好框架 你是公司的第一个爬虫工程师 你要