薛老板

2023-08-11 14:57 北京理工大学产品经理

关注

起薪4万，百度AI产品&研发必懂深度学习实现原理框架（上）

近期有很多社招和校招想要做AI产品经理的小伙伴，都在找我要AI产品经理相关算法的资料，所以老薛我趁周末加班赶工给大家写了两篇文章。

重点给大家分享深度学习的三个经典模型：CNN、RNN和GAN。会帮助大家深度理解当前火热的ChatGPT4.0底层的技术原理。

一、深度学习的前世今生

说到深度学习就不得不先提一个概念--机器学习。

机器学习是人工智能的分支，它专门研究计算机如何模拟和实现人类的学习行为。

在人工智能发展过程中，机器学习占据核心地位。通过各种模型，机器学习可以从海量的数据中习得规律，从而对新的数据做出智能识别或者预测，并且为决策提供支持。

而深度学习正是机器学习的一种。

如下图所示，人工智能是一个范围很大的概念，其中包括了机器学习，机器学习包括了深度学习。

机器学习是人工智能提升性能的重要途径，而深度学习又是机器学习的重要组成部分。

深度学习解决了许多复杂的识别、预测和生成难题，使机器学习向前迈进了一大步，推动了人工智能的蓬勃发展。

那么深度学习又是如何发展起来的呢？

深度学习的概念最初起源于人工神经网络。科学家发现人的大脑中含有大约1000亿个神经元，大脑平时所进行的思考、记忆等工作，其实都是依靠神经元彼此连接而形成的神经网络来进行的。

人工神经网络是一种模仿人类神经网络来进行信息处理的模型，它具有自主学习和自适应的能力。

1943年，数学家皮茨(Pitts)和麦卡洛克(McCulloch)建立了第一个神经网络模型M-P模型，能够进行逻辑运算，为神经网络的发展奠定了基础。

生物神经元一共由四个部分组成：细胞体、树突、轴突和轴突末梢。M-P模型其实是对生物神经元结构的模仿，如下图所示：

左边是生物神经元的示意图，右边是M-P模型的示意图。

为了建模更加方便简单，M-P模型将神经元中的树突、细胞体等接收到的信号都看作输入值，轴突末梢发出的信号视作输出值。

1958年，计算机科学家罗森布拉特发明了感知机，它分为三个部分：输入层、输出层和隐含层。

感知机能够进行一些简单的模式识别和联想记忆，是人工神经网络的一大突破，但这个感知机存在一个问题，就是无法对复杂的函数进行预测。

20世纪80年代，人工智能科学家拉姆梅尔哈特、威廉斯、辛顿、杨立昆(YannLeCun)等人发明的多层感知机解决了这个问题，推动了人工神经网络的进一步发展。

20世纪90年代，诺贝尔奖获得者埃德尔曼提出Darwinism模型并建立了一种神经网络系统理论。

他从达尔文的自然选择理论中获得启发，将其与大脑的思维方式联系在了一起，认为“面对未知的未来，成功适应的基本要求是预先存在的多样性”，这与我们现在谈论较多的模型训练和预测方式相契合，对90年代神经网络的发展产生了重大意义。

在这之后，神经网络技术再也没有出现过突破性的发展。

直到2006年，被称为“人工智能教父”的辛顿正式提出了深度学习的概念，认为通过无监督学习和有监督学习相结合的方式可以对现有的模型进行优化。

这一观点的提出在人工智能领域引起了很大反响，许多像斯坦福大学这样的著名高校的学者纷纷开始研究深度学习。2006年被称为“深度学习元年”，深度学习从这一年开始迎来了一个爆发式的发展。

2009年，深度学习应用于语音识别领域。

2012年，深度学习模型AlexNet在ImageNet图像识别大赛中拔得头筹，深度学习开始被视为神经网络的代名词。

同样是在这一年，人工智能领域权威学者吴恩达教授开发的深度神经网络将图像识别的错误率从26%降低到了15%，这是人工智能在图像识别领域的一大进步。

2014年，脸书开发的深度学习项目DeepFace在识别人脸方面的准确率达到了97%以上。

2016年，基于深度学习的AlphaGo在围棋比赛中战胜了韩国顶尖棋手李世石，在世界范围内引起轰动，这一事件不但使深度学习受到了认可，人工智能也因此被社会大众熟知。

2017年，深度学习开始在各个领域展开应用，如城市安防、医学影像、金融风控、课堂教学等，一直到最近的现象级产品ChatGPT，它在不知不觉中已经渗透到我们的生活中。

二、深度学习的经典模型

经过上面的介绍，我们知道了深度学习属于机器学习，也知道了深度学习是怎样从人工神经网络一步一步发展起来的。

那么，深度学习到底是什么呢？

深度学习是建立在计算机神经网络理论和机器学习理论上的科学，它使用建立在复杂网络结构上的多处理层，结合非线性转换方法，对复杂数据模型进行抽象，能够很好地识别图像、声音和文本。

下面，我们就来介绍两种深度学习的经典模型：CNN和RNN。

2.1 CNN

CNN的全称是convolutional neural network，也就是卷积神经网络。

对卷积神经网络的研究出现于20世纪80至90年代，到了21世纪，随着科学家们对深度学习的深入研究，卷积神经网络也得到了飞速的发展，该网络经常用于图像识别领域。

如下图所示，卷积神经网络共分为以下几个层级部分：输入层、卷积层、池化层、全连接层。

当图像进入输入层，模型会对这个图像进行一些简单的预处理，比如说降低图像维度，便于图像识别。

卷积层里的神经元会对图像进行各个维度的特征提取。这一提取动作不是针对原图像进行的，而是仅对图像的局部进行特征提取，比如说需要识别的是一张包含小狗的照片，神经元只负责处理这张照片中的一小部分，例如狗的耳朵、眼睛。

卷积层对图像进行不同尺度的特征提取，大大丰富了获取特征的维度，有助于提升最终识别的准确度。

池化就是对图像进行压缩降维，减少图像识别需要处理的数据量。

全连接层需要做的就是将前面所提取出来的所有图像特征连接组合起来，如下图，将提取到的小狗的头、身体、腿等局部特征组合起来，形成一个完整的包含小狗的特征向量，然后识别出类别。这就是卷积神经网络进行图像识别的全过程。

通过对卷积神经网络工作过程的梳理，我们可以总结出卷积神经网络的三个特性：

第一，图像识别不需要识别图像的全部，每个神经元只需要聚焦图像的一小部分，识别的难度降低；

第二，卷积层对应的神经元可以应用于不同的图像识别任务，比如上图中的神经元，经过训练，已经能够识别出小狗，那这些神经元也可以应用于识别其他任何图像中的相似物体；

第三，虽然图像特征的维度降低了，但是由于保留了图像的主要特征，所以并不影响图像识别，反而减少了识别图像需要处理的数据量。

这三个特性决定了卷积神经网络非常适合用于图像识别。例如由牛津大学开发的VGG模型就是基于卷积神经网络模型建立的，它在识别物体的候选框生成、图像的定位与检索等方面十分准确，这使得它在2014年ImageNet竞赛定位任务中获得了第一名。

下一篇文章：《起薪4万，百度AI产品&研发必懂深度学习实现原理框架（下）》会继续讲解CNN、RNN和GAN深度学习三大典型模型的详细原理拆解。

***********************************。

**********************************************************************************

#AI##人工智能##产品经理##秋招##求职#

全部评论

推荐最新楼层

薛老板小助理

北京理工大学产品经理

大家有问题可以找我咨询哈，我是薛老板小助理

点赞回复分享

发布于 2023-10-26 16:13 北京

04-17 22:22

中南大学测试开发

字节TikTok测开面经

3.26 字节TikTok测开面经自我介绍项目提问八股就问了一点（没什么印象了）场景题：百度搜索界面，如何测试编程题：寻找字符串的公共前缀反问字节应该是挂的最奇怪的一个了，感觉项目、八股问的答得也都还不错，手撕也撕出来了，场景也答了七七八八，还是挂了。

查看4道真题和解析

点赞评论收藏

04-18 11:42

复旦大学 Java

Agent开发的岗位，简历应该怎么写，一篇文章给你说清楚！

大家好，我是@程序员花海，我看过太多同学的 AI Agent 项目简历，写出来的亮点全是这样的：做了一个 AI Agent 智能助手，集成了大模型、RAG 知识库、MCP 工具调用，实现了自动对话、推文发布、通知推送等功能，提升了效率。这种写法，在大厂面试官眼里，等于没写。很多同学做 AI Agent 项目时，技术栈堆得很满，MCP、RAG、规则树、策略模式、Spring 动态注入、大模型调度…… 看上去非常唬人，可一写到简历上，面试官扫一眼就划走了。问题根本不在你没做东西，而在你没把项目讲清楚。比如看这份简历，表面上用到了各种 AI 相关技术，组件也列得很全，但仔细一琢磨，整体更像是把市面上...

简历中的项目经历要怎么写

点赞评论收藏

不愿透露姓名的神秘牛友

03-15 10:59

已编辑

致自己🙇

给时间时间 终会梦想成真的🥺那就努力努力再努力🤲

爱写代码的菜code...：哎，自己当时拿到字节offer的时候也在感叹终于拿到了，自己当时最想去的企业就是字节，结果还是阴差阳错去了鹅厂。祝uu一切顺利！！！

点赞评论收藏

04-20 11:35

门头沟学院 Java

救命！简历在面试当场被戳穿

前几天面试的时候，因为想让实习经历好看点，硬着头皮说了一句大话，结果面试被面试官当场追问，直接翻车，尴尬到想找地缝钻进去！就是那句“熟练使用LangChain搭建AI项目”，其实我就跟着教程做过一个最简单的demo，连核心逻辑都没吃透，纯纯凑数的，写在简历上的时候就贼心虚，就怕被问到。结果真的怕啥来啥啊，昨天面试，面试官看完简历直接问我，“你用LangChain搭项目的时候，怎么解决Tool Calling的冲突问题？” 我瞬间懵了，支支吾吾说不出来，脸一下子就红了。最后只能老实交代，说自己只是初步接触，还没深入研究，面试官也没为难我，但我能感觉到，他看我的眼神都变了，估计这次面试又凉了。真的...

zhy0428：而且建议是不会的内容写收敛一点，这样被问穿概率低一点

你简历上最心虚的一句话

点赞评论收藏

招聘动态

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

快手

27届实习超多转正机会

联想

2026届校园招聘

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

# 如果有时光机，你最想去到哪个年纪？ #