博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
三分钟教你学会分析MaxCompute消费明细
阅读量:6216 次
发布时间:2019-06-21

本文共 2397 字,大约阅读时间需要 7 分钟。

很多用户经常被MaxCompute收费所困扰,比如执行了一条 select xxx from yyy 然后扣费1元 ,使用了机器学习后扣了1分钱,不知道如何查询到明细,也无法做优化。

接下来,我来教大家学习如何通过控制台消费功能查看你在MaxCompute(DataWorks/Studio)中每一条SQL/MR计算、存储、下载的消费明细。

概要:

场景1,查看昨天的收费情况

场景2,分析某一天计算收费“贵“原因

场景3,分析存储收取1分钱的原因

场景4,分析数据上传和下载是否产生了费用

场景5,分析“不足一天”的数据存储费用

场景6,分析"消费贵"的MR计算费用

cff0c40c580c2460f701c9896ebcb919474d834f

场景1,查看昨天的收费情况

出账后,通过控制台消费明细来查看。

出账时间:

预付费出账单时间次日12点

后付费出账单时间是次日9点

step1 进入阿里云控制台-消费,

step2 打开消费总览,看到当月账单。

bd01ab276680b343c0bc5eaa0a70290ba96d59b0

step3 点击左侧消费明细,根据产品分类Maxcompute及时间来筛选昨天的消费金额,

a2d9a70a11ffd83f925090cb5f5487e0bb587968

step4 点击详情,展开每个项目的消费情况,查看有无“贵”收费

b6bb8ed60c99a94bdf85b4cd1d7823a6ba6f2d09

如发现“贵“的项目,可根据存储、计算、下载几个场景对应到下面的解决方法。

场景2,分析某一天计算收费“贵“原因

通过导出使用记录,分析消费多的作业instance具体情况。

ca2b409604464aef5720c9ab173def56b724c26e

step1 打开消费明细后,看到账单异常后,请到左侧消费记录下载导出使用记录。

a975fb98163160f9a43961cdf7241bb74461230e

step2下载记录后,打开excel表,数据分类
ComputationSql代表SQL计算项
定位异常数据的instanceid。
比如,计量信息编号20171106100629865g4iplf9这个SQL任务,产生的费用是
SQL读取量(7352600872Byte/1024/1024/1024)*SQL复杂度 1 * 0.3元/GB/复杂度=2元 ,计算公式参考官网:

ec020770b80bd08cc2f590907dd6f64fd1345f0a

step3 查看这个“贵”instanceID 的logview

【获取logview信息】wait 20171106100629865g4iplf9  或者 【快速查看SQL语句】desc instance 20171106100629865g4iplf9

22b4eb00118952b051e64f2b20400354b874a031

step4 通过Logview我们发现产生了全表扫描、长尾计算等问题,及时优化我们的SQL/MR作业。

7675c02a43a0cc2e9e40cde46f055703fe0df01b

长尾优化参考:

场景3,分析存储收取1分钱的原因

通过导出使用记录,分析消费多的存储Storage明细。

step1 下载记录后,打开excel表。

65c1a3969db948369828e2deb04930936a279207

step2 查看
数据分类中的Storage存储计费项,会发现在yinlin_test_huabei2_io Project下存储了384字节数据。
按照官网存储定价规则,
存储(384
Byte
/1024/1024/1024)*0.0192元/GB<0.01元,但官网提到小于等于512M数据最低收取1分钱
。计算公式参考官网:

92b88a035d11fac086156815b4945f3592f7dc03

step3 如果这份数据是用来测试的,你可以通过IDE删除Project下的表数据。

场景4,分析数据上传和下载是否产生了费用

部分用户总担心数据同步会产生费用,我们可以通过分析账单来解决。

step1 点击消费明细详情,查看上行、下载有无收费。

我们可以看到收费明细里面并没有上行(UploadIn,UploadEx)计费项,所以用户不必担心数据上传产生了费用。

同时,我们看到了下载产生了0.028元。

67531c72971138f811bbabfbb414cbe6be4fbb8d

step2 通过导出使用记录,分析消费多的下载消耗明细,数据分类DownloadEx代表公网下载计费项

0557e5f98bf1f7388b3cb5b17109ba26b9d22367

step3 可以看到公网下行流量产生了一条约0.036GB(38199736byte)的下行流量,根据官网收费标准,38199736byte/1024/1024/1024)*0.8 元/GB=0.028元。计费公式参考:

step4 下行优化

a 查看你的tunnel设置的service,是否设置成了公共网络。参考:https://help.aliyun.com/document_detail/34951.html

b 如果你本地在苏州,Region在华东2上海,那么你可以先通过华东2的ECS把数据下载到虚机,然后利用ECS包月下载资源。

场景5,分析“不足一天”的数据存储费用

通过导出使用记录,分析存储Storage明细。

step1 下载记录后,打开excel表。

c8222ab07eb1c3ff26fd643ba6646dd04f5bdd69

step2 查看
数据分类中的Storage存储计费项,会发现在alian Project下存储了
333507833900 字节数据,由于是8点上传的数据,所以从9:07点开始计量存储费用,一共计量15小时,注意:天计量范围以结束时间为准,所以最后一条数据不包括在4月4号账单中。
按照官网存储定价规则,

先计算24小时存储价格,

100GB*0.0192 元/GB/天

+(333507833900 Byte/1024/1024/1024-100)GB*0.0096 元/GB/天

=1.92+2.02=3.94元/天
再根据实际存储15小时计算,3.94*15/24=2.46元/天
计算公式参考官网:

场景6,分析"消费贵"的MR计算费用

通过导出使用记录,分析消费贵的MR计算作业。

step1 下载记录后,打开excel表。

72240d6c3e8f45ca94dc6801d1fe8d4354f742e9

step2 数据分类
MapReduce代表MR计算项
定位异常数据的instanceid,对应到计量信息编号。
比如,计量信息编号20171031142154750gyz2qqet这个MR任务,产生的费用是114000Core*Second/3600*0.46计算时/元
=14.57元
,计算公式参考官网:

总结:通过上述几个场景,带大家学习MaxCompute账单的分析方法,希望能够帮到更多的用户。

MaxCompute招聘信息:

bba01b493e1c5d904e882b1c380673c6ebe49a98

 

转载地址:http://pwvja.baihongyu.com/

你可能感兴趣的文章
[LeetCode]--237. Delete Node in a Linked List
查看>>
推荐的套路
查看>>
纯云大数据系统的构建与价值
查看>>
《C语言及程序设计》实践参考——贪财的富翁
查看>>
这是就是联想?2年4次因同一问题返售后,售后找不到确切原因。。。。。
查看>>
导航菜单 JSUI
查看>>
QT实现应用程序重启
查看>>
jade模板引擎学习笔记(WebsStorm9.0.3+ nodejs+express+jade)
查看>>
运维经验分享(二)-- Linux Shell之ChatterServer服务控制脚本二次优化
查看>>
C# 实体类序列化与反序列化一 (XmlSerializer)
查看>>
【解决】Listener refused the connection with the following error 错误解决
查看>>
Java UDP小结
查看>>
编译可在Android上运行的qemu user mode
查看>>
JDK自带XML和java对象相互转换
查看>>
【Go语言】【7】GO语言的切片
查看>>
postgres vacuum row is too big
查看>>
Tomcat 对 Cookie的聪明处理。
查看>>
巧用Linux 架设TFTP Server备份路由器的配置文件
查看>>
fatal: Not a git repository (or any of the parent directories):
查看>>
感悟总结
查看>>