Amazon SageMaker是一个完全托管的AWS服务,使开发人员和数据科学家能够快速,轻松地构建,培训和部署任何规模的机器学习模型。
当使用p2.xlarge或p3.2xlarge高达1TB的内存试图使用预定义的SageMaker图像分类算法的训练工作,我发现了以下错误:ClientError:出...
我收到以下错误,而训练我的模型有超过1个时代[2019年2月6日13时37分08秒警告140231582721856]预期批数:15,不匹配的批数...
无法读取AWS开放的数据集成Sagemaker。错误的下载失败:S3://fast-ai-imageclas/cifar100.tgz到../../../tmp/fastai-images/cifar100.tgz时发生错误(存取遭拒),当...
我在S3的一些数据,我想创建一个lambda函数预测的输出与我的部署AWS sagemaker端点,然后我把输出的S3试。是否有必要在这种情况下创建...
我怎样才能建立一个自定义的火花算法在亚马逊sagemaker-例子/ sagemaker火花/ pyspark_mnist / pyspark_mnist_custom_estimator.ipynb的k均值trainingImage一个trainingImage?
我一直在使用脚本模式与framework_version =“1.12.0”和PYTHON_VERSION =“PY 3”,使用GPU实例安装一个Tensorflow估计在SageMaker。直接调用这个估计的作品,如果我部署...
我见过使用SageMaker地面真相,然后利用这些数据来训练过的,现成的SageMaker型号标签数据的例子。不过,我仍能够使用同样的注释格式TensorFlow ...
我在S3中有一些数据,我想创建一个lambda函数来预测我部署的aws sagemaker端点的输出,然后我再次将输出放入S3。在这种情况下是否有必要创建......
AWS SageMaker GroundTruth权限问题(无法读取清单)
我正在尝试与公共劳动力一起进行简单的GroundTruth标签工作。我将图像上传到S3,开始创建标签作业,自动使用工具生成清单,然后......
将Cifar10数据集转换为Amazon SageMaker的RecordIO格式
我已经下载了cifar-10数据集,需要将其转换为RecordIO格式。如果您解压缩下载的cifar-10-python.tar.gz数据集,您将在下面看到cifar-10-batches-py / cifar-10-batches-py / ...
我创建了一个带有VPC,私有子网和适当安全组的模型。但是,端点URL可以通过互联网访问,但由于缺少安全令牌而失败...
如何使用我自己的Tensorflow代码创建Sagemaker培训作业而无需构建容器?
我正在尝试使用现有的Python类定义Sagemaker Training Job。根据我的理解,我可以创建自己的容器,但不愿意处理容器管理。选择“...时
如何使用ssh_rsa密钥对从jupyter notebook创建永久登录到github
所以我的问题是,在Sagemaker AWS中创建笔记本时,我需要帮助devEngineer将每个实例重启后的密钥保存在.ssh / id_rsa中作为文件。他......
当我尝试训练我的模型时,“内核似乎已经死了”错误。太大了吗?可能是什么问题?
这个问题的其他解决方案都没有对我有用。我正在尝试在亚马逊Sagemaker实例ml.c4.8xlarge上使用15,000GB内存在Jupiter笔记本上训练模型。但是,......
我在aws sagemaker中创建了一个端点并且运行良好,我创建了一个lambda函数(python3.6),它从S3获取文件,调用端点,然后将输出放在S3中的文件中。我想知道我......
SageMaker图像分类:如何获得与模型输出相对应的有序类列表
我正在使用自定义数据集训练AWS sagemaker上的多类图像分类模型。数据集有大约50个类。我正在关注这款笔记本:图片分类转移......
ClientError:未使用AWS object_detection_augmented_manifest_training使用地面实况图像指定列车通道
我已经在AWS基础事实中完成了标签工作,并开始研究用于对象检测的笔记本模板。我有2个清单,其中有293个标记的图像用于火车上的鸟类......
创建SageMaker模型时的ValidationError
我是AWS的新手,并尝试通过参考他们的演示来构建模型(从Web控制台)。但是,当我尝试创建模型时,它会给出以下错误。无法访问模型数据...
我在AWS SageMaker上面临服务tensorflow模型的问题。我已经在SageMaker环境之外训练了模型,现在我有一个savedmodel.pb文件,我需要在...上部署它。
我试图通过AWS Integration从api网关调用sagemaker推理端点。我不想在API网关和sagemaker运行时之间使用lamdba。我按照这个文档来设置API ...